您的位置: 首页 > 文章 > 网络爬虫抓包的使用

网络爬虫抓包的使用

分类: 文章 • 2024-07-08 09:30:10

本文为原创博客，仅供技术学习使用。未经允许，禁止将其复制下来上传到百度文库等平台。如有转载请注明本文博客的地址(链接)。

网络爬虫的第一步就是分析要爬取的数据的类型，这要通过抓包完成。在浏览器里的页面发生的数据通信，只需要打开Chrome的开发者工具，切换到network选项卡就够了。

举个例子，比如要爬取东方财富网的板块数据，链接为http://quote.eastmoney.com/center/BKList.html#trade_0_0?sortRule=0
网络爬虫抓包的使用

1、打开Chrome的开发者工具。
网络爬虫抓包的使用

2、在这个界面里，我们重点看Name下面的一列，显示的是这个网页发出的所有请求。你可以按F5刷新下整个页面，这一列会出现更多请求。
网络爬虫抓包的使用

3、然后在Name下面的一列，开始一个一个找存储真实数据的Response，找到之后对应的Headers中会有真实的URL地址。

网络爬虫抓包的使用