Python中NLTK的安装及测试

Python的自然语言处理工具包(Natural Language Toolkit,NLTK)本身收录了大量的语料资源,如古腾堡语料库(Project Gutenberg)、布朗语料库(Brown Corpus)、就职演讲语料库(Inaugural Address Corpus)和路透社语料库(Reuters Corpus)等,能够为多数自然语言处理提供语料。

1、安装

建议在dos环境下使用pip命令进行安装(尝试过在Pycharm下安装,屡次不成功),需要以下三行命令:

python#切换至python命令行下

pip install nltk

nltk.download()

#因为该资源默认在github网站上,国内网速首先,数据传输经常中断,可以多次尝试。

安装成功界面如下所示:

Python中NLTK的安装及测试

备注:因为该库不大,考虑以后使用方便,所以选择安装所有库。

2、测试

安装成功后,在命令行界面输入以下命令:

from nltk.book import *

如果输出提示语句:

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908

说明安装成功,可以进一步进行使用。