为什么我无法使用wget从S3下载？

问题描述：

wget.download('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv', out='data/')

我得到一个404错误。该网址的格式有问题吗？

这不是HTTP Error 404: Not Found when using wget to download a link的副本。 wget可以很好地处理其他文件。这看起来是S3特有的，这在下面解释。

您如何知道问题出在网址上，而不是我们说的标题？ – DeepSpace

我甚至不知道如何检查。我甚至会寻找什么？ –

您可以使用请求包。 requests.get（url）应该这样做。 –

答

根本原因是在S3中的一个错误，如下所述：https://stackoverflow.com/a/38285197/4323

一种解决方法是使用requests库，而不是：

r = requests.get('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv')

这工作得很好。您可以检查r.text或将其写入文件。要获得最有效的方法，请参阅https://stackoverflow.com/a/39217788/4323