如何用Python搜索互联网?
答
这听起来像你想要一个网络爬虫/刮板。你想拉什么样的东西?图片?链接?只是网络爬虫/刮板的工作。
从那里开始,应该会有很多关于*的文章,这些文章将帮助您实现连接到互联网(获取Web响应)等细节。
请参阅this文章。
答
互联网上的内容远远多于网站,但我认为你只是想抓取一些html页面并从中提取数据。你有很多很多选择来解决这个问题。只是一些出发点:
- 从标准库
- https://pypi.python.org/pypi/requests(更简单,更人性化)的urllib2
- http://scrapy.org/(一个很好的爬行框架)
- http://www.crummy.com/software/BeautifulSoup/(库从提取数据的HTML )
你需要阅读HTTP,HTML和可能的JS/PHP/etc,可能在列表中浸入你的脚趾,以更强大的理解的DOM,然后了解文本解析/处理。看看urllib/urllib2/httplib/requests/etc,以及像BeautifulSoup甚至Selenium,取决于你需要的复杂性和交互性。 – 2013-04-03 22:00:15
你看过[Python文档](http://docs.python.org/2/library/internet)吗?通过以下方式在Google上获得“Python Internet”的首个结果... – kindall 2013-04-03 22:09:49