scrapy爬取网页数据

1．引言
使用python的scrapy模块爬取豆瓣读书top250的图书信息，以json的形式保存并存储到mysql。项目所爬取的网站：https://book.douban.com/top250
2．实现代码

3．运行结果
打开命令行在所在文件目录下运行scrapy crawl doubanbook
scrapy爬取网页数据
Json文件

Mysql

4．总结
在编写本项目时，由于太过心急在未对scrapy模块有充分了解的情况下，就着手编写，导致踩了很多坑。在一番深度学习后，最终解决问题，完成项目。本项目虽然简单，但这次项目，也让我增加了对爬虫技术的些许了解。