scrapy.shell 碰到503的错误

这几天刚刚学习scrapy的时候，有的时候想用scrapy.shell验证一下xpath的正确性，方便点，但经常遇到503的错误，所以总结一下：
打开cmd直接输入scrapy.shell，
scrapy.shell 碰到503的错误
就会报错503

所以我们需要这样做，进入项目的spiders文件夹
scrapy.shell 碰到503的错误
然后就ok了

但是在这之前，我们还需要设置一些东西，进入你要爬的网站，比如http://www.xicidaili.com/nn/ 然后F12打开开发者工具，在network里找到第一个 scrapy.shell 碰到503的错误
把USER_AGENT放到settings.py里去

这样就不会报503的错误了

当然。如果你只是想简单的scrapy shell一下，那么直接在scrapy shell -s USER_AGENT='Mozilla/5.0' +url 就OK了

转载请注明出处