《Python自然语言处理》——导读


《Python自然语言处理》——导读

前 言

这是一本关于自然语言处理的书。所谓“自然语言”,是指人们日常交流使用的语言,如英语、印地语、葡萄牙语等。相对于编程语言和数学符号这样的人工语言,自然语言随着一代代的传递而不断演化,因而很难用明确的规则来确定。从广义上讲,“自然语言处理”(Natural Language Processing,NLP)包含所有用计算机对自然语言进行的操作,从最简单的通过计数词汇出现的频率来比较不同的写作风格,到最复杂的完全“理解”人所说的话,或至少达到能对人的话语作出有效反应的程度。

NLP的技术应用日益广泛。例如:手机和手持电脑对输入法联想提示和手写识别的支持;网络搜索引擎能搜索到非结构化文本中的信息;机器翻译能把中文文本翻译成西班牙文。通过提供更自然的人机界面和获取存储信息的高级手段,语言处理正在这个多语种的信息社会中扮演着更核心的角色。

这本书提供自然语言处理领域的入门指南。它可以用来自学,也可以作为自然语言处理或计算语言学课程的教科书,或是作为人工智能、文本挖掘、语料库语言学课程的补充读物。本书实用性强,包括上百个实例和分级练习。

本书基于Python编程语言及名为自然语言工具包(Natural Language Toolkit, NLTK)的开源库。NLTK包含大量的软件、数据和文档,所有这些都可以从http://www.nltk.org/ 上免费下载。NLTK的发行版本支持Windows、Macintosh和UNIX平台。强烈建议你下载Python和NLTk,与我们一起尝试书中的例子和练习。

目 录

[第1章 语言处理与Python
1.1 语言计算:文本和词汇](https://yq.aliyun.com/articles/95538/)
1.2 近观Python:将文本当做词链表
1.3 计算语言:简单的统计
1.4 回到Python:决策与控制
1.5 自动理解自然语言
1.6 小结
1.7 深入阅读
1.8 练习
第2章 获得文本语料和词汇资源
第3章 处理原始文本
第4章 编写结构化程序
第5章 分类和标注词汇
第6章 学习分类文本
第7章 从文本提取信息
第8章 分析句子结构
第9章 建立基于特征的文法
第10章 分析语句的含义
第11章 语言数据管理
后记