Python中NLTK的安装及测试
Python的自然语言处理工具包(Natural Language Toolkit,NLTK)本身收录了大量的语料资源,如古腾堡语料库(Project Gutenberg)、布朗语料库(Brown Corpus)、就职演讲语料库(Inaugural Address Corpus)和路透社语料库(Reuters Corpus)等,能够为多数自然语言处理提供语料。
1、安装
建议在dos环境下使用pip命令进行安装(尝试过在Pycharm下安装,屡次不成功),需要以下三行命令:
python#切换至python命令行下
pip install nltk
nltk.download()
#因为该资源默认在github网站上,国内网速首先,数据传输经常中断,可以多次尝试。
安装成功界面如下所示:
备注:因为该库不大,考虑以后使用方便,所以选择安装所有库。
2、测试
安装成功后,在命令行界面输入以下命令:
from nltk.book import *
如果输出提示语句:
*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908
说明安装成功,可以进一步进行使用。