python爬虫框架：Scrapy爬取网站数据案例

分类: 文章 • 2023-12-09 17:58:57

实战

1.自动模拟登陆豆瓣

(1).douban.py

(2).setting.py

USER_AGENT ='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'

2.爬取当当网数据入Linux中的mysql

(1)items.py

python爬虫框架：Scrapy爬取网站数据案例

(2)dd.py

python爬虫框架：Scrapy爬取网站数据案例

（3）pipelines.py

python爬虫框架：Scrapy爬取网站数据案例

(4)setting.py中添加

ROBOTSTXT_OBEY = False

ITEM_PIPELINES = {

'dangdang.pipelines.DangdangPipeline': 300,

}