wget的403禁止错误

问题描述：

我想下载源代码，这个网站： http://www.autotrader.ca/cars/bmw/3%20series/qc/montr%C3%A9al/?kwd=335I&prx=100&prv=Quebec&loc=Montreal%2c+QC&trans=Automatic&body=Sedan&sts=New-Used&yRng=2013%2c2014&hprc=True&wcp=True&inMarket=advancedSearch wget的403禁止错误

我都尝试了wget和卷曲，但我不断收到403禁止错误有没有什么办法去解决这个问题？

请注意，计算器约为问题aroound代码开发。你能更具体地说明为什么这与代码有关吗？另外，也许特殊字符在您的命令行中写入不正确？ – Fabien

我试图创建一个webcrawler搜索autotrader找到一辆车，我需要得到的html源代码，这是我遇到的最简单的方法 –

答

您的网站需要Accept-Language头，它使用了基于使用的语言返回不同的内容，您还需要改变用户代理：

curl -s -L -c 'cookies.txt' \ 
    -H 'Accept-Language: en-US,en;q=1.0' \ 
    -H 'User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36' \ 
    'http://www.autotrader.ca/cars/bmw/3%20series/qc/montr%c3%a9al/?kwd=335I&prx=100&prv=Quebec&loc=Montreal%2c+QC&trans=Automatic&body=Sedan&sts=New-Used&yRng=2013%2c2014&hprc=True&wcp=True&inMarket=advancedSearch'

这完美的工作！谢谢 –

相关推荐