如何使用python将抓去的数据写入Excel
使亚博体育【www.yabo166.net】用Python爬虫抓取简书文章标题、作者、发布时间以及正文内容.将这些抓取到的信息存入Excel中.并使用Chrome浏览器对抓取的文章内容做分析.
使用 Chrome 按下F12键,进入开发者模式,就会看到下图中这样.
- 使用鼠标点击定位来准确滚动html页面到视图中.对应title标签.
- 分别查找作者及发布时间对应的标签,并记录下来.
- 文章正文HTML代码的提取就有一些技巧了,我们可以点击段落之间的空白处,这样就可以定位到这个段落所在的DIV标签,而这个DIV标签包含我们需要的所有正文内容.
- 使用BS4/BeautifulSoup4对页面解析获取.
- 进行Excel文件的写入操作需要用到 xlwt 模块.