Python网络爬虫XPath的使用小栈

XPath简介

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。lxml是python中的⼀个包,这个包中包含了将html⽂本转成xml对象,和对对象执⾏xpath的功能。

XPath工具的使用

常用工具;

  • chrome插件XPath Helper
  • Firefox插件XPath Checker

chrome插件XPath Helper为例:
需要的文件
Python网络爬虫XPath的使用小栈

xpath-helper.crx
xpath-helper.rar

chrome浏览器输入:chrome://extensions/
Python网络爬虫XPath的使用小栈
打开开发者模式,将crx文件(直接或后缀修改为rar)并解压成文件夹,点击开发者模式的加载已解压的扩展程序,选择解压后的文件夹,点击确定,安装成功;
Python网络爬虫XPath的使用小栈

重启谷歌浏览器

按ctrl+shift+x