python爬虫之xpath(自用)

模块的使用

在Python中,我们安装lxml库来使用XPath 技术
lxml 是 一个HTML/XML的解析器,主要的功能是如何解析和提取HTML/XML据利用etree.HTML,将字符串转化为Element对象lxml python 官方文档:http://lxml.de/index.html
可使用 pip 安装:pip install lxml
lxml 可以⾃动修正 html 代码

使用

from lxml import etree
这个etree类能干什么?
• 第一个是将html字符串转化为element对象
• 第二个是element对象可以转换为字符串或者二进制类型
python爬虫之xpath(自用)
python爬虫之xpath(自用)