获得405错误,而试图当我尝试下面的代码来下载NLTK数据

问题描述:

获得405错误,而试图当我尝试下面的代码来下载NLTK数据

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')" 

控制台说

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed. 
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405: 
[nltk_data]  Not allowed. 
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405: 
[nltk_data]  Not allowed. 
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed. 
+0

看起来下载服务器已关闭。 –

+0

我在这里看到同样的问题,所以你并不孤单。 –

+0

同样的问题。我想我们应该等待。 –

这是通过Github的原始文件链接的向下年龄引起的。

同时弥补缺口的解决办法是手动下载文件:

PATH_TO_NLTK_DATA=/home/username/nltk_data/ 
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip 
unzip gh-pages.zip 
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA 

我们正在寻找的数据和模型下载替代工作。

同时,@everyone请帮助检查您的脚本并确保您没有超载数据下载!提前谢谢!

请检查https://github.com/nltk/nltk/issues/1787以了解有关此问题的最新更新。

+1

https://github.com/nltk/nltk/issues/1787#issuecomment-318040782这里提到的解决方案适用于我 –

对于MacOSX的 - 小的修改,以上面的回答:

PATH_TO_NLTK_DATA=~/nltk_data/ 
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip 
unzip gh-pages.zip 
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA 

注意,这是一个大的下载(700MB〜)。