为什么我无法使用wget从S3下载?
问题描述:
当我把https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv放到浏览器中时,我可以下载文件没问题。但是,当我说,为什么我无法使用wget从S3下载?
wget.download('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv', out='data/')
我得到一个404错误。该网址的格式有问题吗?
这不是HTTP Error 404: Not Found when using wget to download a link的副本。 wget可以很好地处理其他文件。这看起来是S3特有的,这在下面解释。
答
根本原因是在S3中的一个错误,如下所述:https://stackoverflow.com/a/38285197/4323
一种解决方法是使用requests
库,而不是:
r = requests.get('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv')
这工作得很好。您可以检查r.text
或将其写入文件。要获得最有效的方法,请参阅https://stackoverflow.com/a/39217788/4323
您如何知道问题出在网址上,而不是我们说的标题? – DeepSpace
我甚至不知道如何检查。我甚至会寻找什么? –
您可以使用请求包。 requests.get(url)应该这样做。 –