爬去贴吧图片
爬去贴吧图片
本次爬去贴吧图片运用的是request模块和正则表达式。爬去的网站链接
我们要将爬去贴吧图片分为三步(爬去图片网址自选):
1,获取网页的HTML
2,找到图片的链接
3,保存图片!!!
一,获取爬取的网址
首先我们引入re和request模块
其次获取网页的HTML
**二,**找到图片的链接
我们需要用到正则表达式
图片的格式基本一样有共同的后缀.jpg
**三,**保存图片
保存图片首先要给爬去的图片编号,按照爬去顺序编号最为简单方便。
编好号后直接将图片保存在文件夹内
这样图片就爬取下来啦。
下面是完整版的代码