人工智能的距离——从脱离肉体的比特到人类般的行为和思考

2011年2月,在IBM的超级计算机沃森取得了两场《危险边缘》(美国知名智力竞赛节目)冠军赛的胜利后,各种媒体开始对AI展开了七嘴八舌的讨论,就像14年前,沃森的前辈——深蓝在一场国际象棋比赛中击败了世界冠军卡斯帕罗夫。众多博主、记者、主持人又开始了这个老生常谈的问题,这个问题自从计算机科学出现就一直萦绕在我们心头——计算机何时可以超过人类智力?


       深蓝和沃森展现的是一种抽象的、“脱离肉体存在”的智力,这在近几年一直饱受认知学家和机器人学家的质疑。印第安纳大学的Colin Allen一直从生理化、具体化的角度来探索人类和动物不断演化的认知,这不仅包括我们的大脑,还包括我们的整个身体,甚至是周围的环境。这个关于认知的新观点为智能机器人的设计提供了更多的可能性。真正的智能机器人不仅要拥有身体化、具象化的智力,还要可以对外部环境进行感知和反馈,而这恰恰是今天的深蓝和沃森们所不具备的。


1、会思考的机器人


       机器人先驱深蓝在1989年曾输给过卡斯帕罗夫,后来在1996年,深蓝取得了进步——赢了卡斯帕罗夫一局比赛,终于在1997年,深蓝依靠自己不断升级的软件击败了卡斯帕罗夫,而后者曾谴责说,深蓝的软件就是基于他的下棋风格量身打造的。卡斯帕罗夫在路透社采访时表示,他从“外星人对手”身上可以看到了“智力的影子”,虽然这种智力风格与人类存在区别。卡斯帕罗夫输的并不是心服口服,因为在他眼里,深蓝就是针对他的风格进行了软件定制和升级,这只是一种计算能力的提升,而非真正的下棋水平的进步。事实确实如此,深蓝每走一步其实是在检查了每个棋子移动带来的各种组合之后做出的,它用的是典型的计算机思维——在把所有路径尝试一遍后找到最佳。这当然不是人类的下棋方法。


       卡斯帕罗夫抱怨的有道理,下棋这种游戏就是一种在数量上有限制的博弈树,计算机可以轻而易举的穷举出所有可能,人类下棋时的运筹帷幄、相互博奕等智力体现对于计算机来说其实就是计算,这确实与智力无关。


       沃森也是利用这种类似的“外星人方法”赢得了比赛。它展现出的最重要的技能是破译出游戏中提到的种种扑朔迷离的线索,然后以此为关键字在庞大的数据库中做一个简单的搜索,最后找到相关信息。虽然沃森在比赛时没有联网,但工程师已经事先几乎把所有互联网上的信息都存储到了沃森的数据库中备用。


       沃森、深蓝和其他在智能机器人方面的尝试都有一种共同点——他们都是一种脱离肉体的、抽象的智力。国际象棋有着一系列规则和固定的棋盘格局,这很容易被计算机掌握;而《危险边缘》则具备程序化的问题和答案,这使得沃森的研发重点完全为软件算法,开发者无需考虑人类身体那般的复杂物理运动的协作。沃森唯一需要设计的机械部分就是帮助其按抢答器的“手”。


       自计算机出现,抽象化的智力方式就受到科学家的喜欢。1950年,阿兰图灵设计了著名测试机器和人是否可以区分的“图灵测试”,裁判同时像计算机和人询问相同的问题,如果裁判根据得到的答案无法区分出谁是计算机,谁是人类,则表示该计算机具备了人类的智力水平。参加图灵测试的机器人也被设计成没有实体——图灵认为相对于智力,实体无关紧要。测试的谈话仅限于使用唯一的文本渠道,例如计算机键盘和屏幕,这样的结果是不依赖于计算机把单词转换为音频的能力。图灵认为,对于打印文本的限制可以更加公平的区分出人类智力和机器智力。


       但是,设计一个可以像人类一样正常交谈的电脑却异常艰难。我们在谈话中会感知自己所处的物理空间,会敏锐的察觉到语言交谈中在声音、情感方面的细微差别。沃森不具备自然语言能力,当人类对手在倾听主持人说出的各种线索时,它其实是文本的数字信号。Siri虽然拥有声音认知能力,但其对用户讲话含义的误解程度已经众所周知了。目前的机器认知都缺乏这些真正的交流方式,所以他们才会有一种看起来非常怪异、完全不符合人类智力特征的“外星人”智力。


 2、缺少生物特征的机器人


       在人工智能早期,大家普遍认为对于机器人来说最困难的工作是下棋、回答问题等人类特有的行为,也是人类与其他动物划清界线的行为。但后来却发现,走路、觅食等行为也是同样困难,甚至是更难。机器人学家发现,软件和硬件在短短的几年内根本无法获得人类那种在漫长进化中才能形成的行为。


       通过对动物的仔细观察发现,自然界在塑造生物时有着非常多的且不易察觉的技巧和细节,人类和动物的智力不仅有大脑有关,还包括整个身体。


       这就是为什么我们会觉得深蓝、沃森和Siri的智力如此“外星人”的原因。虽然它们之中有两个会讲话,但没人会走路,也缺乏那种寻求外部资源和能量来维持自身生存的生物本能。它们无法解释自己的感觉,它们具备的是一种类似于人类演讲的局限性很强的输出方式,因为它们这种能力来自于固定的编程。简言之,这些系统缺乏智力生物的绝大多数基本特征。


       如今的人工智能不仅缺乏感知功能,还缺乏基础的短期记忆,它们无法在当前所做的事情和10秒钟之前、10分钟之前或者10小时之前做的事情之间建立起一个灵活的联系。由于缺乏感知、寻找食物和同伴的欲望、规避风险的本能,深蓝、沃森和Siri在智力水平不仅远远没有达到人类的水准,甚至还不如小狗和鸵鸟等动物。


 3、有身体的机器人


       庆幸的是,机器人领域自图灵时代起已经在发生着变化。我们对人类和动物认知系统的物理实体和认知系统与外部环境的融合已经有了越发深入的了解,这会为人工智能的设计提供不少灵感。应用机器人领域在发展有实体的认知方面也取得了常足进步,而大家对人工智能目标的讨论也更具实际意义,而不是单纯的开发一些只能用来赢得电视娱乐比赛的机器人。


自主hua机器人的设计目标为独立、可行动和可适应多变的环境。这不是那些在流水线处理重复人物的工业机器人,也不是iRobot的清洁机器人或谷歌自动驾驶汽车。自主化机器人能够感知到外部环境中的各种实体,并对外部变化适时做出恰当反应,而不是几个月前提前预设好。


       具备实体的智力模式还可以繁殖出更加先进的智能机器人,这些机器人可以通过视觉和触觉来搜集关于物体的信息,甚至通过对它们的视觉重构来解决问题。这包括MIT设计的社交机器人——Ripley,它能更好的学习语言,德国KIT科学家研发的ARMAR-III可以在一般的家居环境中与人类进行交流。通过与环境中的物体进行交流,Ripley和ARMAR-III每天都可以学到各种动作的物理特征,还能学会服从命令。


       机器人对环境实时反馈的运作机制最先在控制论中有所涉及,其核心是对动物行为控制中的反馈回路进行分析。控制论学家发展了这一理论,他们认为为了在一定的功能范围内维持该系统,寻求一种积极反馈和消极反馈的平衡最为必要。我们反馈回路的存在会使之前的行为结果影响到将来的行为,例如,打冷颤会提高身体温度,然后就会停止打冷颤。


       控制论中的一个核心观点是,我们在与环境持续的交互过程中会形成感知活动的反馈回路,而认知则包括这些反馈回路的精确协作。这些回路不仅涉及神经系统,还涉及我们的身体和其所存在的环境。通过一个例子可以说明环境变化引起的修正在此回路中的重要性,当我们在吃饭时,是外部环境中“面前不断减少的食物”给了我们暗示让我们停止吃饭,而不是那个“告诉我们吃饱了”的身体内部信号。有实验表明,人们在用较大的容器吃饭时会多吃三分之二,但不会意识到自己吃的更饱。


 4、从技术到人性


       我们从实体化和环境嵌入式的角度来分析人类认知能力不仅可以改变我们对人类意识的理解,还可以理解如何将人类般的智力复制到机器中。在Colin Allen的书《 Moral Machines》中,他认为我们每天的道德能力不仅依赖于经济学中抽象的效用公式,还会依赖身体和参与环境的能力来察觉到引起我们不适和紧张的信号并做出恰当反应。人工智能在有实体的生物智力方面还有很长的路要走,也有很大的进步空间。随着不断进步,我们建造的智能机器人将变得不再那么“外星人”,也将更容易被我们当作我们的其中一员而理解和接受。


上一篇:再造金山,WPS的30年


下一篇:腾讯这一年