python抓取京东历史促销信息并做统计分析的学习笔记
参考链接:http://www.sohu.com/a/214617344_654419
github链接: https://github.com/hscheng/python
参考博文和github均有详细代码,本文记录自己学习过程,
初始链接:https://www.jd.com/moreSubject.aspx,分析网页内容,标红的页面开始是没有的,多点几个页面就会出现
打开链接出现如下json格式内容:
接下来就开始爬去网页内容了:
这样就把数据加载出来了,接下来分析所爬取的数据内容,
词云:出现品类最高的词为满减、折,
每年促销数量:15年至今促销数量大幅下降,18年创历史新低,有两种可能一、小型促销减少大型促销增加,二、上市之后财报原因,减少了促销数量