Python爬虫(五)

lxml获取日期

lxml使用xPath获取日期,xPath比较像路径

import requests
from lxml import etree
link='https://blog.****.net/even160941/article/list/1?'
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:66.0) Gecko/20100101 Firefox/66.0'}
r=requests.get(link,headers=headers)
html=etree.HTML(r.text)     ##转换成lxml格式
date=html.xpath('//span[@class="date"]/text()')     ##使用xpath获取信息,//span选取span元素,【】表示选取class为date的span元素,/text表示提取其中的文字
for each in date:
	print(each)

Python爬虫(五)
Python爬虫(五)