2.1 什么是机器人
对于一部关于发展型机器人的书来说,机器人的定义和其核心特征无疑是最显而易见的出发点。
从历史的角度来看,“robot”源自斯拉夫语中的“robota”,它的原意是指奴隶或被强迫的劳动力。“robot”这个单词的首次出现是在捷克作家Karel apek的剧本《罗素姆的万能机器人》(Rossums Universal Robots,1920)中。这个词源标志着,创造机器人的目的和主要用途是在日常生活工作中服务人类、在一些工作场所中完全或部分代替人类(如工业机器人)。
那么,究竟什么是机器人呢?牛津英语词典是这样定义的:机器人(robot)是能够自动执行一系列复杂动作的机器,尤其是可以通过计算机来编程控制的机器。这个定义中有四个关键概念对发展型机器人学的研究具有重要意义:①机器,②复杂的动作,③自动,④能够通过计算机编程实现。第一个概念机器非常重要,因为这一点包含了目前被认为是机器人的各种各样的设备平台。当然,我们也可以直接认为机器人就是类似于人的机器(包括类人和人形,这两种机器人的定义和区别将在接下来提及),正如我们曾经在著名电影《A.I.》(Artificial Intelligence,人工智能)中看到的那样。实际上,目前世界范围内使用的
19绝大多数机器人是在工厂中进行重复性工作的工业生产和装配机器人,它们都是没有类似于人的样貌的机器。这些工业机器人有着多关节的机械手臂,主要用来完成工业生产中的精密工作,如在汽车工厂中进行金属模块的焊接、在食品包装厂中进行物体的移动和升降。其他常见的机器人形态还有各种轮式移动机器人,它们的主要用途是在工厂里搬运箱子和部件,也有越来越多的圆盘式机器人在人们日常生活中扮演真空吸尘器的角色。
在牛津英语词典中,机器人定义的第二个概念是机器人能够完成一系列复杂的动作。这个概念在某种程度上是正确的,例如,很多生产型工业机器人能够很好地完成一些高精度的操作任务,然而现在使用的大多数机器人能够做到的仅仅是一些简单的、重复性的工作。总的来说,目前绝大多数机器人工作的主要目的是节省时间和提高安全性。
第三个概念自动是机器人的核心本质特征。正确区分机器人和机器设备的关键是,机器能否在没有人类直接、连续控制的时候自动运行。尤其是当机器人能够感知环境状态(包括机器人自己的内部环境)并且能够对环境进行操作时,自动性(automaticity)(自主权——有待商榷)指的是机器人能够根据感知到的信息来选择正确动作、完成特定目标的能力。这一点更好地反应在Matari'c对机器人的定义中:“存在于自然界中的一种自主的系统,能够感知环境并基于环境信息来完成目标”(Matari'c 2007,2)。
有一个与“自动性”相似的术语经常在认知型和发展型机器人中使用,并且也在Matari'c的定义中提到,那就是“自主”(autonomous)型机器人。这个术语目前依然指的是拥有基于综合的、高层次的决策能力的自主性能力,能够自主地完成各种任务的机器人。这里要强调的是,机器人能够根据传感器的反馈信息和自身的内部认知系统,自动地选取适当的动作来完成任务。然而,还应当注意的是远程遥控机器人也属于机器人的范畴,但是它依然需要人类操作者的远程遥控,并没有展现自主性。就像医学上的外科手术机器人一样,它在手术中并不是完全自主性地工作,而是在手术过程中为外科专家提供服务支持(提供一种安全、微创的方式),这种机器人仅仅能够半自主性地完成部分外科手术任务。
最后,机器人定义中的第四个关键的概念是能够通过计算机编程实现,这意味着该机器可以通过人类专家编写的计算机软件来控制。但是,这已经远远超出了纯粹编程的观点,编写具有认知功能的程序与发展型机器人学是紧密相关的。如何通过计算机编程、人工智能算法和行为控制的认知理论,设计和实现具有意识的机器人控制器(控制框架),无疑是
20这一领域最具挑战性的工作。
通过对机器人(robot)定义和核心特征的分析和解释,可以看出“机器人”这个术语并不具有单一、明确的含义。这些分析暗含了机器人的概念是在两个不同极端之间的连续区间范围。从外表特征和机械角度的观点来看,这些连续性存在于外表类似于人的机器人和工业机器人(家用真空吸尘器)之间,类人外表的机器人是一个极端表现,没有类人外表的机器人是另一个极端表现。从控制的角度来看,机器人的范畴包括从完全自主控制的系统到半自主性控制(或者叫作远程遥控)的系统。对机器人行为能力范围的界定则是从操纵简单、重复性的动作到完成复杂任务。对于机器人的各方面的研究,例如,机器人外表特点、控制方法、行为特征以及多种多样的应用领域,感兴趣的读者可以参考Siciliano和Khatib编写的综合性书籍《Springer Handbook of Robotics》(2008)。
类人机器人
考虑到类人和类婴儿机器人平台在发展型机器人学中的广泛应用,我们在这一小节中将主要论述类人机器人的定义,并讨论类人机器人和人形机器人之间的区别。首先,类人机器人有着拟人化的身体设计(例如,拥有一个头、躯干、两条胳膊和两条腿)和类人的感觉器官(例如,获取视觉信息的摄像机,感知听觉信息的麦克风,感知触觉的触觉传感器等)(de Pina Filho 2007;Behnke 2008)。这类机器人的外观各有不同,有如图2-1a所示的可以看到内部器件连线的复杂电子机器人,也有如图2-1b所示的拥有塑料外壳且好似穿着航天服的机器人或玩具。
类人机器人中有一种特别的类型,那就是人形机器人。这种类型的机器人除了有拟人的身体外形,还有仿人的“皮肤”外表(图2-1c)。人形机器人的典型例子是Hiroshi Ishiguro及其团队在日本大阪大学以及ATR智能机器人和通信实验室研发的Geminoid成人形机器人(Nishio、Ishiguro和Hagita 2007;Sakamoto等人2007)。当然,发展型机器人的研究中也存在一些婴儿、儿童类型的人形机器人,如有着四岁女孩外形的Repliee R1型机器人(Minato等人2004,详见2.3节)。
图2-1 a)带有视觉电子设备的COG类人机器人,由Brian Scassellatti提供;b)拥有塑料外壳的iCub类人机器人,由意大利理工学院Giorgio Metta提供;c)Geminoid H1-4人形机器人与他的制造者Hiroshi Ishiguro,由大阪大学Hiroshi Ishiguro提供(Geminoid是国际先进通信研究院(ATR)的注册商标)
人形机器人的设计目标一直是致力于消除人和机器人在外形和行为上的区别(MacDorman和Ishiguro 2006a)。由于在人-机器人交互过程中使用人形机器人会出现“恐怖谷”(uncanny valley)现象,因此,理解人形机器人的设计内涵便显得极其重要。随着具有人类外表的机器人的迅速发展,Mori(1970/2012)最早提出了“恐怖谷”理论,他假设了一种转变关系来表现人类对具有人类外表的人形机器人的认同或反感。厌恶和恐惧的感觉——也就是“恐怖谷”——是由于人形机器人在行为和外表上没有取得完全类人的品质而引起的。21图2-2展示了Mori的“恐怖谷理论”表示曲线,对应的是机器人的仿人外观和人类认同度之间的关系,其中“恐怖谷”是出现在曲线中的一段下降陡坡。从工业机器人到玩具机器人的转变来看,机器人在外表方面只是局部与人类相似,并期望能提高人类对它们的认同度。虽然机器人假肢与人类手臂几乎没有区别,但是,其外表和动作上细微的缺陷就会引起人类的恐惧感,从而导致认同感曲线的下降(恐怖谷理论由此产生)。就其本质而言,恐怖谷是机器人和人-机器人交互研究中的关键问题。受到Mori的恐怖谷假设和仿人机器人(包括计算机图形仿真、虚拟智能体)的人-机器人交互现象的影响,很多研究者已经开始研究生物学和社会学上的因素(MacDorman和Ishiguro 2006b)。
图2-2 恐怖谷现象。改编自Mori 2012
发展型机器人学主要是以类人机器人为基础。但是很多的研究者(尤其是在日本)已经在研究类人-人形婴儿机器人平台的用途(Guizzo 2010)。在2.3节中,我们将对在发展型机器人研究中使用的婴儿机器人进行详细综述,这其中包括类人机器人和人形机器人。当然,22我们也会提及一些移动机器人研究,如SONY AIBO型机器狗。但是在那之前,我们需要对构建机器人平台的执行器和传感器的基本概念和技术进行快速学习和了解。