Python爬虫（五）

lxml获取日期

lxml使用xPath获取日期，xPath比较像路径

import requests
from lxml import etree
link='https://blog.****.net/even160941/article/list/1?'
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:66.0) Gecko/20100101 Firefox/66.0'}
r=requests.get(link,headers=headers)
html=etree.HTML(r.text)     ##转换成lxml格式
date=html.xpath('//span[@class="date"]/text()')     ##使用xpath获取信息，//span选取span元素，【】表示选取class为date的span元素，/text表示提取其中的文字
for each in date:
	print(each)

Python爬虫（五）

lxml获取日期

相关推荐