wget的403禁止错误

问题描述:

我想下载源代码,这个网站: http://www.autotrader.ca/cars/bmw/3%20series/qc/montr%C3%A9al/?kwd=335I&prx=100&prv=Quebec&loc=Montreal%2c+QC&trans=Automatic&body=Sedan&sts=New-Used&yRng=2013%2c2014&hprc=True&wcp=True&inMarket=advancedSearchwget的403禁止错误

我都尝试了wget和卷曲,但我不断收到403禁止错误 有没有什么办法去解决这个问题?

+0

请注意,计算器约为问题aroound代码开发。你能更具体地说明为什么这与代码有关吗?另外,也许特殊字符在您的命令行中写入不正确? – Fabien

+0

我试图创建一个webcrawler搜索autotrader找到一辆车,我需要得到的html源代码,这是我遇到的最简单的方法 –

您的网站需要Accept-Language头,它使用了基于使用的语言返回不同的内容,您还需要改变用户代理:

curl -s -L -c 'cookies.txt' \ 
    -H 'Accept-Language: en-US,en;q=1.0' \ 
    -H 'User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.109 Safari/537.36' \ 
    'http://www.autotrader.ca/cars/bmw/3%20series/qc/montr%c3%a9al/?kwd=335I&prx=100&prv=Quebec&loc=Montreal%2c+QC&trans=Automatic&body=Sedan&sts=New-Used&yRng=2013%2c2014&hprc=True&wcp=True&inMarket=advancedSearch' 
+0

这完美的工作!谢谢 –