2.爬虫数据提取——Xpath环境配置

爬虫数据提取——Xpath环境配置

一、什么是Xpath语法?

xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历。简单来说,我们的数据是超文本数据,想要获取超文本数据里面的内容,就要按照一定规则来进行数据的获取,这种规则就叫做Xpath语法。

二、通过规则怎样定位数据?

XPath 用于在 HTML 文档中通过元素【HTML标签】属性【HTML标签的属性】进行数据的定位。

举例如下:

2.爬虫数据提取——Xpath环境配置

三、安装Xpath环境

(1)谷歌浏览器

进入谷歌浏览器的扩展程序,将xpath插件直接拉到插件栏即可,然后重启谷歌浏览器,即可发现已经将xpath插件安装成功。

2.爬虫数据提取——Xpath环境配置

2.爬虫数据提取——Xpath环境配置

2.爬虫数据提取——Xpath环境配置

(2)qq浏览器

直接再应用中心搜索Xpath,然后找到安装即可,重启浏览器即可使用。【不再详细演示】

2.爬虫数据提取——Xpath环境配置