关于自然语言处理学习

By | 2018年5月9日

自然语言处理学习

自然语言处理是计算机科学领域与人工智能领域的中的一个重要方向。它研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及所有用计算机对自然语言进行的操作

基于《python自然语言处理》一书的学习过程分享,我想更精简的提取出书中有用的东西,使其能快速上手使用。特此放到GitHub上不断更新。

按照书中的顺序

1. 语言处理的基础

2. 结构化程序设计

3. 语言处理的基本原理(标注,分类,提取)

4. 句子解析,句法结构识别,句意表达方法

所谓“自然语言”,是指人们日常交流使用的语言。相对于编程语言和数学符号这样的人工语言自然语言随着一代代的传递而不断演化因而很难用明确的规则来确定。从广义上讲,“自然语言处理( Natural Language Processing,NLP)包含所有用计算机对自然语言进行的操作,从最简单的通过计词汇出现的频率来比较不同的写作风格到最复杂的完全“理解”人所说的话,或至少达到能对人的话语作出有效反应的程度,NLP的技术应用日益广泛。例如:手机和手持电脑对输入法联想提示和手写识别的支持:网络搜索引擎能搜索到非结构化文本中的信息:机器翻译能把中文文本翻译成西班牙文。在应用领域,包括从事人机交互、商业信息分析、Web软件开发。

教程基于 Python编程语言及名为自然语言工具包( Natural Language ToolkitNLTK)的开源库。

关于我对自然语言了解,其实以前不清楚这个方向,是在找了学校的导师后才知道有这样一个方向,和大多数人一样一开始不清楚自然语言代指什么,如何处理,它的运用场景在哪里,后来在百度云里看到自然语言处理接口,包括基础写的情感分析,文章分类,到中文词向量,CNN模型建立,更感受到这门学科的庞大。后来一直在和老师做蒙古文的自然语言处理,接触一些皮毛,并未深入的学习。最近看到《python自然语言处理》这本书有了兴趣,想看一遍,对其能有所了解,会简单的运用一些。

发表评论

电子邮件地址不会被公开。 必填项已用*标注