python快速使用Urllib爬取网页
import urllib.request(先导入Urllib模块)
file=urllib.request.urlopen("http://www.baidu.com")(定义file变量,爬取百度网页)
data=file.read() (读取网页全部内容)
print(data)
fhandle=open("E:/学习文件夹/python练习/2.html","wb") (将爬取到的网页保存到指定目录,并以“wb”即二进制写入的方式打开)
fhandle.write(data) (打开后将句柄赋给变量fhandle,然后使用write()方法写入data,写入后在通过close方法关闭文件)
fhandle.close()
然后运行:
只是图片暂时没有爬取出来。。。