一步步教你玩爬虫:爬取简单新闻标题

好久没有使用python 爬取数据,这段时间没事重新学学爬虫,也是给新手一个参考(喜欢的进,不喜的可以跳过)。

进入正题,这章我们使用urlib库和re来获取百度新闻网页数据

 

首先查看源代码,分析页面结构

一步步教你玩爬虫:爬取简单新闻标题

一步步教你玩爬虫:爬取简单新闻标题

接下来执行我们的代码就可以获取到标题数据

一步步教你玩爬虫:爬取简单新闻标题