python简单爬取小型网页图片

这周忙着各种复习考试和补课真的是有点晓凡，差不多快落了有一个兴趣没学习了，突然想着python可以爬取文字，那肯定也可以提取图片吧。果不其然，前辈们都为我们这些小白做出了贡献，模仿着以前大佬的提示，我也爬到了女神的照片哈哈

# coding=gbk

import urllib.requestimport reimport os

#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码

def getHtml(url):

page = urllib.request.urlopen(url)

html = page.read()

return html.decode('UTF-8')

def getImg(html):

reg=r'src="(http://imgsrc.*?\.jpg)"'

imgre = re.compile(reg)

imglist = imgre.findall(html) #表示在整个网页中过滤出所有图片的地址，放在imglist中

x = 93 #因为文件夹有92张图，所以从93开始计数。依次增加

path = 'F:\\郑秀晶手机' # 将图片保存到F:\\郑秀晶手机文件夹中

if not os.path.isdir(path):

os.makedirs(path) paths = path+'\\' #保存在F:\\郑秀晶手机路径下

for imgurl in imglist: urllib.request.urlretrieve(imgurl,'{}{}.jpg'.format(paths,x))

#打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串

x = x + 1

return imglisthtml = getHtml("http://tieba.baidu.com/p/5775270416")

#获取该网址网页详细信息，得到的html就是网页的源代码

print (getImg(html)) #从网页源代码中分析并下载保存图片

下面是爬的结果

这是爬的网页地址： http://tieba.baidu.com/p/5775270416 python简单爬取小型网页图片