Python爬虫框架开发环境简介和Scrapy安装

一、开发环境

Centos6.0

Scrapy1.5

Python3.6

Mongodb3.6

Pycharm


二、Scrapy1.5安装

pip install scrapy

如果Python3.6时通过编译安装的,先进行如下设置,设置环境变量,设置别名。

Python爬虫框架开发环境简介和Scrapy安装

                Python爬虫框架开发环境简介和Scrapy安装

安装遇到的问题:

Python爬虫框架开发环境简介和Scrapy安装

pip无法请求HTTPS类型的网站,原因是缺少SSL模块。解决办法安装openssl-devel。命令是 sudo yum install -y openssl-devel

Python爬虫框架开发环境简介和Scrapy安装

SSL安装成功

Python爬虫框架开发环境简介和Scrapy安装

现在执行pip3 install scrapy 还是报错,这是因为我们的Python3.6是通过编译安装的,所以要重新编译Python以兼容SSL模块。

Python爬虫框架开发环境简介和Scrapy安装

Python爬虫框架开发环境简介和Scrapy安装

编译安装执行make && make install完毕后,再执行pip3 install scrapy又报了一个错误,找不到twisted大于13.1.0的版本。

Python爬虫框架开发环境简介和Scrapy安装

打开浏览器,输入https://pypi.org/ 搜索twisted并下载。完成后通过rz命令导入到服务器中,移动到soft文件中。使用tar -xvjf 进行解压缩,进入到解压后的twisted文件中,使用Python3 setup.py install安装。

再次pip3 install scrapy,成功。安装位置在python安装文件的bin目录下,编辑.bashrc,设置别名。使用source .bashrc编译。在命令行输入scrapy即可。