IBM海法研究院Project Debater 首席研究员Noam Slonim博士(左)、Project Debater 全球经理Ranit Aharonov博士(右)
还记得Project Debater吗?IBM今年推出的首个能与人类辩论的AI系统。
今年6月,Project Debater参加了在旧金山举行的与人类辩论高手PK的公开辩论赛。在没有提前获知辩题的情况下,Project Debater依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。智能进化论曾做过详细报道,《AI首次实现与人类辩论,IBM Project Debater真正想突破的是什么?》
9月7日,进化君视频采访了Project Debater团队的几位科学家,包括来自以色列IBM海法研究院的Project Debater首席研究员Noam Slonim博士、Project Debater团队经理Ranit Aharonov博士,以及IBM AI Tech副总裁Aya Soffer博士。
IBM为什么要研究会辩论的AI?Project Debater遇到的难题是什么?创新在哪里?下一步将如何发展?关于外界关注的这些问题,几位科学家用通俗易懂的表达做了详尽解释。
IBM为什么要教机器辩论?
当Watson 2011年在《危险边缘》(Jeopardy!)益智问答中击败人类选手后,IBM的AI研究人员便开始寻找下一个具备重大挑战的研究领域。科学家们希望,新的方向既要与人类实际生活相关,在难度上又要超越AI此前能够解决的挑战。
虽然公开辩论不是一个常见的场景,但辩论的能力却是人们制定决策的关键,不管在日常生活还是工作中。被誉为批判性思维(Critical Thinking)圣经之作的《学会提问》一书中指出,无论总统还是普通人,都要面临一个问题,那就是当别人告诉你要做A,要做B,甚至A和B 是相反的意见时,我们需要运用批判性思维,在这些不同的意见中做出独立的明智的决策判断。
Aya Soffer博士介绍,“真实世界中,我们并不需要像《危险边缘》那样完成很多琐碎的知识问答,而是要回答真正重要的问题,并做出真正重要的决策。决策的重要性决定了我们确定要把辩论功能作为AI的下一个重大挑战去做相关研究。”
此外,辩论还是一个开放式的挑战,这与之前AI所解决的挑战都不同。此前,不论益智问答还是下围棋、玩电脑游戏,这些活动都有明确的衡量输赢的标准。辩论则像在真实世界中做商业决策一样,没有清晰的以绝对的分数高低衡量输赢的简单标准。
由此,Project Debater的应用主要集中在两个领域,第一是有研究、分析、收集信息需要的人士。如金融分析师、律师、记者、科学家等。他们需要就某一个主题寻找相关信息,并且以相关的方式去组织这些信息,了解其利与弊。
第二个是需要做决策的领域,比如企业董事会成员和高级管理人员。往往他们要做决策是自己尚未充分了解的内容,面临非常多的信息。Project Debater可以帮助他们迅速了解一个问题的正反两面,做出更好的基于证据、基于关键信息的决策。
Project Debater团队经理Ranit Aharonov博士表示,“由AI辅助去解决大多数不是非对即错、非赢即输的问题,将是AI将来发展的一个方向。”而辩论本身不是为了输赢,而是为了获得更多的决策角度。
“基于循证、基于证据的决策,这是非常大的待开发的AI领域,所以可以通过辩论去实现这一个领域的落地。”Aya Soffer博士强调。虽然有着广泛的应用场景,科学家们也表示,目前Project Debater还处在研究初级阶段,没有商业应用的计划。但是,Project Debater具备的自然语言理解相关的能力,会进入到Watson产品为更多企业服务。
IBM海法研究院Project Debater 首席研究员Noam Slonim博士(右)、Project Debater 全球经理Ranit Aharonov(左)接受视频采访
Debater是如何应对即兴、不可预测的辩论内容的?
在6月份旧金山的公开辩论赛中,Project Debater事先没有拿到任何辩题。和人类选手一样,拿到辩题后只有30分钟的准备时间。在这期间,Project Debater需要首先分析辩题,然后扫描拥有3 亿多个可靠信息来源的庞大语料库,通过算法找出与辩题相关性最高的观点性内容,同时减少重复信息,最终形成有说服力的论点和支撑论据。
这一过程中,Project Debater主要依靠三大能力:一,数据驱动的演讲稿撰写和表达,即从大量语料库中寻找素材并撰写结构良好的演讲内容;二、听力理解,能够识别长段连续口语中隐含的重要概念和观点,这与只需要听懂一句话的语音助手完全不同;三、模拟人类困境(dilema),针对性地提出有原则的论点。
在*辩论环节,Project Debater很难预测对方会怎样说。那么,它是如何实时应对完全即兴的、不可预期的辩论内容,并做出针对性的反驳的?这可以说训练Project Debater辩论时最大的挑战。
Noam Slonim博士详细解释了Project Debater如何应对这一挑战:通过构建知识图谱,针对不同论证中的共同点建模,形成辩驳的能力。
“举个例子,比如说涉及到是否要禁止人体器官贸易,是否要禁止酒精贸易。人们可以自然而然地推断出,如果禁止相关交易,将导致黑市蓬勃发展的风险。模拟这一场景,可以为Project Debater建模,当遇到类似有关禁止类型的辩题时,Project Debater就可以依据模拟好的知识图谱,等待着与黑市相关话题的出现,然后去寻找与黑市相关的论证就可以了。”
但是事情没有这么简单。比如美国最近讨论比较多的热门话题,是否禁止在公共场合母乳喂养。同样是禁止相关内容,但跟黑市一点关系都没有。
“所以我们需要在这些方面不断去建模、扩大语料库,包括人类丰富的语言中各种细微和微妙的地方。这样Project Debater在已经建模的知识图谱中,才能够更加精准地为自己导航,找到支持自己论点的内容。”Noam Slonim博士强调。
Project Debater的学习模式
学会辩论的Project Debater是否会像Alpha Go那样能够自动学习,越来越聪明?
科学家们解释说,Project Debater并没有用到训练Alpha Go的强化学习工具。强化学习是机器学习中一个重要的类型,其典型特点就是在没有人为指导的情况下,通过不断的“试错”获得反馈来提升任务性能。但反馈需要明确的衡量标准,比如会导致游戏赢还是输。
但是Project Debater的辩论场景是开放式、不是非赢即输的,人们对于辩论陈述的好坏评价是非常主观的判断。进化君理解,Project Debater 的训练中使用了深度神经网络和弱监督学习。深度神经网络(DNN)和弱监督都要用到有标签的数据去培训机器做出正确的回答。
据介绍,除了人工标签,研究人员还教会Project Debater通过关键词判别标签,比如一旦句子中出现“认为”、“想”、“假定”、“相信”等表达,这就判定为属于陈述内容。科学家开发了多种工具和方法,以弱监督方式训练DNN,以获得训练需要的大量人工标记的高质量数据。
此外,Project Debater是否会向人类中的一级辩手中学习?
Ranit Aharonov博士表示,“在涉及到通过建模去模拟人类困境的时候我们听取*辩手的意见,参考他们是如何应对在同样一个话题下不同观点的冲突。”
Project Debater的构成要素与潜在应用(来源:IBM海法研究院)
Project Debater的下一步,让人工智能更像人
作为项目的首席研究员,Noam Slonim博士加入IBM已经11年了,自2012年至今都专注于Project Debater的研究。虽然Debater团队成员已经在各种高质量科学会议上发表了30多篇作品,并开创了计算辩论(Computational Argumentation)这一全新领域,但Noam Slonim博士认为Project Debater处在早期的阶段,有长足发展空间。“有太多有趣的问题等着我们去发掘。就计算辩论本身而言就有太多有趣的问题。”
Noam Slonim博士认为,在亚里士多德提出的辩论三元素(logos逻辑、pathos情感、ethos可信)中,目前的AI研究还需要超越logos(逻辑)阶段。
Project Debater的最终目标也许并不是让机器像人一样*辩论或者比人辩论得更好,而是促进AI在语言理解领域的研究。语言理解一直都AI领域的重点,也是IBM在AI研究方面关注的重点。科学家们认为,目前所有企业在这个方面的研究还远远不够。
“Project Debater下一步是怎么样的,就是要让人工智能更像人。我们希望AI下一步的发展是从比较窄的例子上学习,扩展到比较宽泛的领域、跨不同领域的应用,以及能够从概念上学习。不是仅仅是再学习的能力,而是自己去推理的能力。”Aya Soffer博士表示。
原文发布时间为:2018-09-25
本文作者:进化君