Stanford NLP课程简介
1. NLP应用例子
- 问答系统: IBM Watson
- 信息提取(information extraction)
- 情感分析
-
机器翻译
2. NLP应用当前进展
很成熟:垃圾邮件检测,词性标注(POS),实体名称识别(Named Entity Recognition, NER) => 课程后面会讲
相对成熟:情感分析,指代消解(coreference resolution),词义消歧,句子成分解析(parsing),机器翻译, 信息提取 => 后面课程会讲
依然纠结:问答系统, 转译(paraphrase),主题总结,对话系统3. 为何NLP如此难搞
主要原因:歧义
- 句法歧义(syntactic ambiguity):由于句子中某一成分可以由多个词来承担导致的歧义。例子:
vs
vs -
词义歧义(word sense ambiguity):由于某个词具有多个含义导致的歧义。例子:
如何消岐(具体以后讲):解析句子结构
其他原因:4. 解决NLP问题的所需知识和方法
5. 课程将要讲述的用于统计自然语言处理的方法和理论以及具体应用案例
6. 所需背景知识
7. 传送门:https://www.youtube.com/watch?v=nfoudtpBV68