NLTK下载SSL:证书验证失败

问题描述:

当试图安装PUNKT为NLTK我得到以下错误:NLTK下载SSL:证书验证失败

nltk.download('punkt')  
[nltk_data] Error loading Punkt: <urlopen error [SSL: 
[nltk_data]  CERTIFICATE_VERIFY_FAILED] certificate verify failed 
[nltk_data]  (_ssl.c:590)> 
False 

的下载脚本坏了。由于暂时的解决方法可以手动从here下载punkt标记器,然后将解压缩的文件夹放在相应的位置。每个操作系统的默认文件夹是:

  • 的Windows:C:\nltk_data\tokenizers
  • OSX:/usr/local/share/nltk_data/tokenizers
  • Unix的:/usr/share/nltk_data/tokenizers

这意味着你没有使用HTTPS与其他运行时工作始终Python的依赖关系等。

如果您使用的是Linux(Ubuntu)

~$ sudo apt-get install ca-certificates 

应该解决这个问题。

如果您在具有docker文件的脚本中使用此脚本,则必须确保已将ca-certificates模块安装到docker文件中。

运行Python解释器并键入命令:

import nltk 
nltk.download() 

从这里:http://www.nltk.org/data.html

如果你得到一个SSL /证书错误,运行此 /应用/ Python的3.6 /安装Certificates.command

从这里:ssl.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:749)

首先去的路径/应用/ Pyth在3.6 /并运行 安装Certificates.command

您将同样的管理权限。

如果你无法下载它,那么作为其他答案建议你可以直接下载并放置它。您需要将它们放在以下目录结构中。

> nltk_data 
      > corpora 
        > brown 
        > conll2000 
        > movie_reviews 
        > wordnet 
      > taggers 
        > averaged_perceptron_tagger 
      > tokenizers 
         > punkt