《中国人工智能学会通讯》——1.9 总结

1.9 总结

综上所述,近年来,一方面,得益于 Wikipedia 等众多高质量的开放资源,知识工程取得了突飞猛进的进展;另一方面,基于统计机器学习的自然语言理解
技术和工具日益发展成熟。这两方面分别为智能问答技术奠定了资源基础和技术基础,使得智能问答技术更加快速地走入人们的生活。然而,基于知识的智能问答系统仍面临以下关键性问题。

一方面,知识难以描述和统一,人们在不同领域为了不同的任务定义和管理了各自的知识库,造成了大量异构数据的存在,这些数据在局部范围内是组织良好的信息资源,但是若不能把这些异构分散的知识资源整合在一起,也只能是形成了一些独立的信息孤岛,不能满足用户的统一查询需求。目前类似BabelNet 12 等项目也只是简单地融合不同知识库中的相同概念,实现异构知识资源的融合和联合查询是当前知识管理和知识服务技术发展中亟待解决的问题。

另一方面,虽然词性标注、主题抽取、文本分类等自然语言处理任务日趋成熟,但是在需要深层语义理解的任务中,例如语义角色标注、语义解析、篇章结构分析等,还停留在抽取简单的普通关系和结构层面上,对于深层的小众的情况还远未涉及,例如当前很少有问答系统能处理到量词辖域问题。要做到真正的语言理解就需要处理非限定形式的语言现象。在技术上,不仅需要建立语言符号和世界知识之间的丰富关联,还需要构建快速的语义组合机制,使得它们能够应对庞大知识库上的搜索空间。诚如 KennethChurch 在文章《钟摆摆得太远》 [28] 中所言,我们目前只是摘取了较低、较容易的果实,还有大量的处于更高、更深的语义果实有待挖掘。因此,目前还需要大规模、高效率的面向非限定领域的自然语言深度语义理解技术。

最后,网络上有大量新的信息和知识不断涌现,基于固定模式 (schema) 的知识表示和服务方案难以满足用户的需求,如何提取新知识、挖掘隐含知识,是智能问答等知识服务系统是否能实用的有效指标。另外,人类的知识是非常复杂的,不仅包括后天习得的世界知识和语言知识,还包含大量的先天知识和社会知识,目前的语言知识库、世界知识库虽然数量有了显著的变化,但是远远不能涵盖人类知识。目前的世界知识库的知识类型主要是事实性的知识,欠缺常识知识。常识知识在人类推理过程中具有非常重要的作用,而很多常识知识难以规范化。因此,如何在智能问答中融合常识等知识进行推理,是也是智能问答中的关键问题。

上一篇:StartDT_AI_Lab | 开启“数据+算法”定义的新世界


下一篇:PostgreSQL 自定义函数表达式选择性评估算法 - Statistics, Cardinality, Selectivity, Estimate