数据挖掘之自然语言处理
NLTK是python上著名的自然语言处理库,自带语料库、词性分类库、自带分类、分词等等功能。
安装语料库import nlk
nlk.download()
文本处理流程
最后从文本转换为一组数字,这些数字就隐含了文本的意义。
stopwords:对于注重理解文本意思的应用场景来说歧义太多,所以要去掉。
NLTK在NLP上的经典应用有情感分析、文本相似度、文本分类。
NLTK是python上著名的自然语言处理库,自带语料库、词性分类库、自带分类、分词等等功能。
安装语料库import nlk
nlk.download()
文本处理流程
最后从文本转换为一组数字,这些数字就隐含了文本的意义。
stopwords:对于注重理解文本意思的应用场景来说歧义太多,所以要去掉。
NLTK在NLP上的经典应用有情感分析、文本相似度、文本分类。