在Python中从URL中获取HTML
我正在尝试使用Python
来读取HTML
中的一个URL
的内容。要获取URL
的HTML
内容,我是否会完全使用模块wget
,urllib
或其他模块?在Python中从URL中获取HTML
之后回答: 我将使用urllib
模块,因为它带有默认的Python 2.7版本,我无法从此计算机下载外部模块。模块的
列表,取指URL内容:
Wget
Beautiful Soup
Urllib
Requests
这里是一个样本,让你开始用requests
:
import requests
resp = requests.get('http://httpbin.org/get')
if resp.ok:
print (resp.text)
else:
print ("Boo! {}".format(resp.status_code))
print (resp.text)
这是最简单的。如果您使用的是Python3.x,请将'print resp.text'替换为'print(resp.text)'。 –
除此之外:http://httpbin.org是用于测试客户端的极好资源。 –
谢谢,@ 345243lkj - 我修正了样本和评论。 –
您是否尝试过'BeautifulSoup'? –
是的。有多种选择(向列表中添加请求),您可以使用其中的任何选项。 – tdelaney
你能告诉我们你试过了什么吗?本网站上有很多关于此主题的问题和解答。你有具体的问题吗? – MooingRawr