在Python中从URL中获取HTML

问题描述：

我正在尝试使用Python来读取HTML中的一个URL的内容。要获取URL的HTML内容，我是否会完全使用模块wget，urllib或其他模块？在Python中从URL中获取HTML

之后回答：我将使用urllib模块，因为它带有默认的Python 2.7版本，我无法从此计算机下载外部模块。模块的

列表，取指URL内容：

Wget 
Beautiful Soup 
Urllib 
Requests

您是否尝试过'BeautifulSoup'？ –

是的。有多种选择（向列表中添加请求），您可以使用其中的任何选项。 – tdelaney

你能告诉我们你试过了什么吗？本网站上有很多关于此主题的问题和解答。你有具体的问题吗？ – MooingRawr

答

这里是一个样本，让你开始用requests：

import requests 

resp = requests.get('http://httpbin.org/get') 
if resp.ok: 
    print (resp.text) 
else: 
    print ("Boo! {}".format(resp.status_code)) 
    print (resp.text)

这是最简单的。如果您使用的是Python3.x，请将'print resp.text'替换为'print（resp.text）'。 –

除此之外：http://httpbin.org是用于测试客户端的极好资源。 –

谢谢，@ 345243lkj - 我修正了样本和评论。 –

在Python中从URL中获取HTML

相关推荐