一、智能聊天机器人
1.智能聊天机器人
用自然语言模拟人类的一种对话形式。人机对话的程序。
主要分为三个方面:
--问题咨询:基于业务知识库进行业务问题回答。
--数据检索:通过程序找到相对应的数据。
--业务处理:对应相关业务系统转到指令。(例如:订个机票,订个酒店等等一些任务)
典型业务场景:
业务咨询问答机器人,智能客服机器人,行政助理机器人,产品推荐机器人......
2.聊天机器人的本质:会话式UI
会话式:就是相互对话闲聊,对话。根据你说的信息完成相应的任务。
会话式UI的优势:1.可以任何聊天,没有任何成本
2.信息密度得到控制,精度提升
3.保留聊天内容,按时间顺序排序
3.基于检索VS基于生成模型
简单总结:
基于检索和生成模型,目前来说基于检索更适合现在的选择。
基于检索的特点:聊天的时候是先知道回复的内容,回复更准确。
基于生成的特点:聊天的时候会生成新的回复内容,不重复性,方便。
基于检索的优点:问题与答案都是经过人工总结的,保证了数据中的答案的正确性,易于理解。
生成模型的优点:不需要预先存储好的数据,更加灵活多变。
基于检索的缺点:用户每提出的问题都要从库里找答案,问题有限,需要不断更新数据
生成模型的缺点:生成的答案存在语法或语义不相关,生成模型需要海量的数据,难以优化结果无法控制。
商业现状:适合特定领域内、问题集合有限。检索模型和生成模型两者结合,适合用于各个领域。
二、机器人的核心技术
1.聊天机器人最核心的部分是对话引擎,对话引擎包括以下几点:
自动语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)
和文本到语音的合成(TTS)
首先自动语音识别(ASR):就是用自己的话理解,听到用户输入的语音,转化为机器能听懂的语音。
自然语言理解(NLU):根据用户说的一句话可以理解你的需求。(将非结构化数据,半结构化数据转为结构化数据,主要做实体识别、关系抽取、知道意图)
对话管理(DM):对整个会话有一个生命周期,会实施查询你的状态,保留历史记录。(还有插槽信息,插槽下文会提到)
自然语言生成:根据用户说的话会自动生成一些话。(这里主要分为封闭式和开放式,简单介绍封闭式:用户提的问题 知道就回答,不知道的就不回答,开放式:可以不断学习进行生成)
文本到语音合成(TTS):最后会以语音的形式返回用户,用户说的是声音,听到的也是声音。
2.本质是自然语言处理技术
简单流程: --自然语言--模型--数据处理(向量)
--模型:对数据处理(结巴等一些处理工具)
--向量:把数据处理成机器可以看懂的数据(例如:Id2char,char2id)
--基于NLP,利用文本的相似度,提取关键信息,进行文本分类。
机器人的原理:
QA机器人:
假如用户输入问题为Q。(QA数据库中的QA对为(Q1,A1),(Q2,A2),......(QN,AN))
QQ相似度计算:计算Q与每个QA对中问题的相似程度。
QA匹配度计算:计算Q与每个QA对中答案的匹配程度。
综合相似度与匹配度,找到最合适的一组QA对(QI,AI)。
本质:基于检索的问答模型。
核心问题:文本语义相似度问题。
适合模型:bert(对文本向量化,对问题向量化,然后点乘找出最相似的) word2vec(向量化,主要基于词的向量化)
向量化的几种形式:
Word2vec(词向量)
doc2vec(句子向量化)
Bert(句子向量化)
Simbert(相似度匹配 相似度生成)
Gensim(文本相似度分析,首先分词,然后建立字典进行相似度匹配)
闲聊机器人:
闲聊机器人可以根据生成式模型来做,没有限制。
闲聊机器人的原理
首先定义一个非常大的数据库,根据用户输入的内容进行文本匹配。
生成模型可以随便生成任意的文本,进行聊天。
闲聊机器人原理:
根据用户说的一些话,会去激活任务机器人。
任务机器人原理:
任务机器人主要内容:
1.意图识别:根据输入的一段话 提取到这句话意图。(要去做什么?)
2.槽值提取:提取意图 提取实体。
3.触发任务:根据插槽的提取 来做相应的任务 返回给终端答案。
3.话题追踪:多轮对话上下文自动补全。
这里说一下插槽slot:
根据提取的特征返回输出的内容。
多轮会话(就是根据插槽slot实现的):经过多次对话,根据意图提取,实体提取。(举例简单说明:假如我要查询一下郑州今天的天气,这里面意图(Location)是查天气 实体(Time)是郑州 今天)。
场景机器人原理:
业务流程:
1.根据客户的信息,来驱动场景。
2.这些场景都是事先设置好的
举例说:(就像我们10086客服一样,打电话的时候,一般都会说:普通话请按1,查话费请按2等等一些)这就是场景。
KG机器人的原理(这里是关于知识图谱,我的博客里面有知识图谱,不细说):
三、智能客服机器人
主要用于服务客服一线同事的,帮助人员减轻压力,提升效率。
财富智能助手机器人:
这里包括:投前、投中、投后、销售政策、产品介绍、销售技巧等等一些(简单了解)
保险智能机器人:
AIOps运维机器人:
什么是运维:运维就是后台的一些东西,做完东西部署外网,档期,出现问题可以报警等等。