如何使用python将抓去的数据写入Excel

使亚博体育【www.yabo166.net】用Python爬虫抓取简书文章标题作者发布时间以及正文内容.将这些抓取到的信息存入Excel中.并使用Chrome浏览器对抓取的文章内容做分析.

使用 Chrome 按下F12键,进入开发者模式,就会看到下图中这样.

如何使用python将抓去的数据写入Excel

  1. 使用鼠标点击定位来准确滚动html页面到视图中.对应title标签.
  2. 分别查找作者及发布时间对应的标签,并记录下来.
  3. 文章正文HTML代码的提取就有一些技巧了,我们可以点击段落之间的空白处,这样就可以定位到这个段落所在的DIV标签,而这个DIV标签包含我们需要的所有正文内容.
  4. 使用BS4/BeautifulSoup4对页面解析获取.
  5. 进行Excel文件的写入操作需要用到 xlwt 模块.

先放一张代码截图供参考

如何使用python将抓去的数据写入Excel

使用 save_as_xls 将抓取到的数据依次写入Excel中即可.效果如下图

如何使用python将抓去的数据写入Excel