chat bot(聊天机器人)解密

最近百度组织架构调整一则消息,值得关注:度秘升级为事业部,由原微软小冰创造者之一的景鲲担任总经理,直接向CEO陆奇汇报。

事实上,2017 年度秘已经占据了不少新闻版面。比如在 2017 CES 上,由度秘研发的 DuerOS 正式亮相,这是一个基于语音交互的新一代人工智能操作系统,同时还联合小鱼在家一起推出了个人助理机器人,该产品也被 CNN 评为 2017 CES 上 14 项最酷产品之一。此次升级度秘事业部,也彰显出度秘、DuerOS在百度整个人工智能布局里的重要地位。

一、度秘是什么?

度秘(英文名:Duer)是百度出品的对话式人工智能秘书,在2015年9月由李彦宏(Robin)在百度世界大会中推出。通过语音识别、自然语言处理和机器学习技术,用户可以使用语音、文字或图片,以一对一的形式与度秘进行沟通。

度秘可以在对话中清晰的理解用户的多种需求,进而在广泛索引真实世界的服务和信息的基础上,为用户提供各种优质服务。比如一键叫车、订个喜欢吃的外卖、买张熟悉位置的电影票、预定心仪的餐厅,还有智能化叫醒起床等。跟其他的萌宠网络机器人不同,度秘的定位是专业、实用、优质的体验。

度秘的产品能力:

chat bot(聊天机器人)解密

度秘涉及的技术:
chat bot(聊天机器人)解密

二、核心关键技术是:语音识别,多轮对话,语义搜索。分别讲一讲:

1、语音识别技术。当前都比较成熟了,主要是特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软的研究员2009年注意到,此前人们在训练神经网络识别语音时忽略了一个重要问题——协同发音(Coarticulation)建模。将这种简单的方法与DNN结合,一下就产生了飞跃。有意思的是,如果将这种方法应用于非DNN,效果并不特别明显,若单纯使用DNN,也无法取得如此惊人的突破。看着错误率比之前的方法一路降低至32%,这个32%识别率的改善于2011年秋季在意大利佛罗伦萨的Interspeech语音国际会议上发表,对语音研究界起了极大的冲击。从此以后,世界各地语音识别的研究与开发都开始了DNN尝试。

2、多轮对话技术。我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。

如果做多轮对话,也是在单轮对话的基础上做一些简单的处理。技术主要包括基于手写规则的,和基于数据驱动的。比如,六十年代就有著名的Eliza系统问世,基于手写规则,能与用户进行简单的对话,使许多用户感觉到好像是在跟真人进行交流。Siri之后,有许多对话产品出现,包括谷歌Now,微软Cortana。国内有许多聊天机器人发布,如微软小冰,受到广泛瞩目。据我们所知,大部分的对话系统都是基于规则,或者基于数据的。

自然语言对话的研究与开发,虽然取得了一定的进展,但离实现人工智能的理想,甚至离实现在复杂场景下的实用化还有很大距离。自然语言对话有许多应用场景。比如,如果用户能够通过对话在智能手机上完成订酒店之类的复杂任务,那么手机就会真正成为用户的得力助手。这里的核心问题是如何“理解”用户的语言,帮助用户完成任务。现在的语音助手还不能做到这一点。再比如,许多公司有呼叫中心,在电话上回答用户提出的各种问题。如果能够实现自动呼叫中心,机器来回答用户的问题,就能大大提高服务的效率和质量。这里的核心问题也是自然语言对话。

3、语义搜索技术。通过语音识别和多轮对话,获取了用户的意图,接下来就是返回用户所需要的东西。语义搜索简单的说就是让机器、软件理解人类语言获取真正希望的信息。这里面的概念就很多了,知识图谱,语义网络,实体搜索。讲一讲实体搜索,实体搜索是语义搜索的一种典型实现。

实体(entity)搜索是相对于关键词(keyword)搜索而言的,传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但对于"搜索引擎"这个系统自身而言, 其实并不了解搜索query本身有什么意思, 对于搜索"盗梦空间"和"喵喵喵", 搜索引擎做的事情基本差不多. 你告诉他要找什么, 他就去按照字面意思勤勤恳恳的去找. 搜索引擎无法直接回答query, 只能做一个信息的中转。实体搜索关注的重点不是"关键词"级别的信息,而是"对象", 比如: 人, 电影, 软件, 小说, 公司, 组织等等. 从关键词向实体转化, 希望可以从更精细的角度来理解和组织搜索结果. 在一定程度上可以理解query的意思,并给出自己的答案。一些更智能更个性化的交互也依赖于实体作为基础, 比如搜索"好看的电影",直接返回用户期望的电影。

上一篇:Cointelegraph预测:2021至2022年可能推出的前5个CBDC


下一篇:Linux性能监测面板 | NETDATA