日前,国际权威研究机构IDC发布了《IDC MarketScape 全球对话式AI平台厂商评估报告》,阿里云智能客服以突出的多轮对话能力、低代码可视化操作、自训练的语义模型等产品技术优势,以及阿里业务规模和丰富场景下积累的领域经验和应用,成为国内唯一入选IDC全球MarketScape报告解决方案提供方,且取得Major Players位置。
据IDC在报告称,阿里云智能客服具备一系列领先优势:具备内置的FAQ、任务式问答、知识图谱以及表格问答引擎,可以灵活支持单轮和多轮对话;完善的快速冷启动和高效部署的工具集,可支持低代码可视化操作,为开发人员和生态ISV提供开放的API与客户系统(如CRM)或数据平台做深度集成。
“如果正在寻找一家功能强大,久经考验的厂商合作对话式AI应用,尤其是在亚洲,应考虑阿里云智能客服。”IDC在报告中建议其客户。
阿里云智能客服的核心算法来自达摩院对话智能团队, 2017年开始团队从0打造了阿里云智能客服的整套核心引擎,目前整个对话引擎的主要架构如下图:
在任务型对话方面,打造了面向第三方开发者的对话开发平台Dialog Studio,目前该平台为云(阿里云智能客服)、钉钉(钉钉官方智能工作助理)、阿里经济体(手淘等数十个BU)等业务提供海量的人机对话服务,疫情期间基于该平台的疫情外呼机器人为全国24个省提供1800万+次外呼服务,荣获人民网“人民战疫”一等奖。
在将Dialog Studio大量落地应用于各个行业领域的过程中,主要面临着两个挑战:第一个是在涉及多行业、场景分散的toB业务中,怎么能解决低资源小样本下的语言理解问题;第二个是如何把多轮对话管理(Dialog Management)从业界普遍的状态机推进到深度学习模型,让多轮对话具备持续学习的能力。
在低资源的语言理解方面,我们在业界和学术界,率先将few-shot learning引入到人机对话领域,并且从人类的小样本学习机制出发,提出了归纳网络(Induction Network【1】)和记忆网络(Dynamic Memory Induction Network【2】),分别发表在EMNLP2019和ACL2020上,这两篇论文目前的引用量在90左右,为该方向的典型论文;在多轮对话管理方面,我们引入了用户模拟器,把用户模拟器和对话系统结合在一起,通过两者之间的Self-Play产生海量的标注数据来解决数据难题,从而实现了对话管理从状态机到模型的进步,并且进一步提出了Meta-Dialog Model【3】,解决多轮对话数据的迁移学习问题,相关成果发表在ACL2020上。
在表格问答方面,这里通过一个例子来介绍TableQA。首先有一个理财产品的Table,围绕这个Table, 用户可能会问:“收益率大于3.5%且保本型的理财产品最低起投金额是多少?”,要想解决这个问题,需要先把自然语言转换成一个SQL语句,然后用SQL语句去查询表格,最终就可以回答这个问题。
TableQA是最近两年里发展最快的一种问答方式。从2017年开始重新被发掘出来,2019年的时候这个方向的研究开始加速,达摩院对话团队也是在2019年启动了对TableQA的研究。经过过去一年多的发展,目前我们在国际四大数据集(榜单)上都取得了第一名的成绩,整体处于国际领先位置。
在图谱问答方面,系统打造了从文档到图谱的整条低成本构建链路和产品,在运营商、保险、政务行业提供基于图谱的问答服务,实现从文档中构件图谱并问答的整套低成本构建体系。
知识图谱问答(KBQA)是指通过语义理解模型将用户输入的query解析成sparql查询语言,并从构建的图谱中自动查询得到用户答案。达摩院对话团队自成立后即2018年启动了对KBQA的研发。经过3年的发展,目前我们在国际公开数据集ComplexWebQuestions Freebase的LeaderBoard上排名第一,超过Google 4.1% ;并在QALD-8、LcQuAD 2.0 取得SOTA结果。目前,已支持运营商、政务、金融等多个行业的业务。
此外,为了降低KBQA的标注成本,将图谱中知识融入到预训练模型KGBert中。基于KGBert的KBQA模型只需为每个属性配置20条话术,准确率即可达到80%以上。此外我们在FewClue公开榜单和CCF举办的《预训练模型知识量度量》比赛中均获得了第一名。
作为面向ToB的产品,阿里云智能客服在低代码开发方面也走在业界前列。其中在2017年推出的任务型对话引擎Dialog Studio,就采用了low-code的设计思路,将对话抽象为“用户说、机器想、机器说”三类基础节点,通过拖拽式连线即可实现任务型对话的构建。
阿里云智能客服于2015年试运行,最早主要为商家提供智能客服能力以缓解大促期间巨大的服务压力。2016年,逐步赋能阿里巴巴生态圈如Lazada、盒马、阿里健康等事业部 。2017年正式对外向*、企业和开发者开放。
截止当前,阿里云智能客服已围绕客户服务的全链路场景,打造了智能对话机器人、智能质检、智能对话分析、智能策略中心、智能辅助、智能外呼等产品家族,为10万付费企业提供了对话式AI相关服务,在制造、零售、金融、交通、通信、政务等近20行业沉淀了成熟的解决方案和客户案例。
据6月份发布的IDC《中国AI云服务市场2020年度市场研究报告》,阿里云公有云对话式AI产品已占据40%的市场份额,位居首位,接近二三名的市场份额之和。
参考文献:
【1】Ruiying Geng, Binhua Li, Yongbin Li, Xiaodan Zhu, Ping Jian, Jian Sun, Induction Networks for Few-Shot Text Classification, EMNLP 2019.
【2】Ruiying Geng, Binhua Li, Yongbin Li, Jian Sun, Xiaodan Zhu, Dynamic Memory Induction Networks for Few-Shot Text Classification, ACL 2020.
【3】Yinpei Dai, Hangyu Li, Chengguang Tang, Yongbin Li, Jian Sun, Xiaodan Zhu, Learning Low-Resource End-To-End Goal-Oriented Dialog for Fast and Reliable System Deployment, ACL 2020.
【4】Guanglin Niu, Yang Li, Chenguang Tang, et al. Relational Learning with Gated and Attentive Neighbor Aggregator for Few-Shot Knowledge Graph Completion[J]. arXiv preprint arXiv:2104.13095, 2021.
【5】Taolin Zhang, Zerui Cai, Chengyu Wang, et al. HORNET: Enriching Pre-trained Language Representations with Heterogeneous Knowledge Sources[C]// Proceedings of the 30th ACM International Conference on Information & Knowledge Management. 2021: 2608-2617