本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第1章,第1.5节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.5 小结
总而言之,本章致力于为自然语言处理这一领域提供一份简要概括。虽然,本书假定读者在NLP领域,以及使用Python编程方面具有一定的背景知识,但我们也提供了一份与Python和NLP相关的快速入门。我们带你安装了所有在NLTK工作中将会用到的程序。另外,我们还通过几行简单的代码给你演示了NLTK的使用思路。我们提供的是一个了不起的词云实例,这是在大量非结构化文本中进行可视化处理的一种好方法,同时也是文本分析领域中相当流行的一种运用。我们的目标是要围绕着NLTK构建起所需要的一切,并让Python在我们的系统上顺利地工作。为此,你也应该要能编写并运行基本的Python程序。除此之外,我也希望读者能亲身感受一下NLTK库的魅力,自行构建出一个能实际运行的、涉及云词的小型应用程序。只要读者能顺利地产生出云词,我们就认为自己功德圆满了。
在接下来的几章中,我们将更为详细地了解Python这门语言,及其与处理自然语言相关的特性。另外,我们还将探讨一些基本的NLP预处理步骤,并了解一些与NLP相关的基本概念。