新的人工智能在模拟战斗中击败人类专家


新的人工智能在模拟战斗中击败人类专家


 ◆ 

导 读


美国业内专家Gene Lee最近测试了辛辛那提大学(UC)博士生开发的人工智能(AI)。Gene Lee 是美国空军退役上校,拥有丰富空战经验,也是在高仿真空战模拟器特别是模拟战斗机方面颇有专攻的教练兼空战管理员。


绰号ALPHAAI在跟Lee的模拟对抗中胜出,并被Lee称作他迄今见过的最具攻击性、反应最灵敏、最灵活、最可信的AI


ALPHA是遗传模糊系统在应用领域的重大突破。由于这项AI专为在虚拟空战中搭配无人战斗机而设计以便于相关研究,相关论文发表在最近一期的国防管理期刊(Journal ofDefense Management)杂志上。


ALPHA项目以及用于创建ALPHA的工具都是Psibernetix公司研发的。这家公司最近由UC工程与应用科学学院2015级博士生Nick Ernest(公司总裁兼CEO)以及David Carroll(公司主任程序员)联合创立;由 Gene Lee, Kelly CohenUC航空航天学教授),Tim ArnettUC航空航天学博士生)以及美国空军研究实验室的赞助者们提供技术和研究支持。


 ◆ 

压力高节奏快:AI对打陪练

 

ALPHA目前被视为一项用于研究在虚拟环境中载人机和无人机合作编队的工具。在最早的研发迭代中,ALPHA的表现就持续优于美国空军研究实验室在先前研究中使用的基准计算机程序。换句话说,它已经击败了其他AI对手。

 

事实上,正是因为ALPHA在之前迭代中就有完胜其他计算机程序的表现,去年十月Lee开始手动控制模拟器去试试更成熟版本ALPHA的身手。在模拟器上的多次长期交火中,Lee多次尝试后不仅没能消灭ALPHA一次,最终还落得次次都被ALPHA击落的下场。

 

自从第一次人类和ALPHA在仿真中交战,这个人工智能反复击败其他专家,甚至能在它(ALPHA控制的)飞行器的速度、转向、投弹能力和传感器等方面被故意破坏的情况下与其他人类专家对抗中胜出。


从20世纪80年代早期开始,Lee一直在模拟器中飞行对抗人工智能对手,说起了第一次遭遇对抗ALPHA,“我对它的意识和反应感到惊讶,它似乎能马上意识到我的意图,针对我在飞行中变化和投弹部署有相应的反应。它知道防御我的攻击。它能在攻击和防御中根据需要瞬间转换。”


他补充说,针对大多数人工智能,“一个经验丰富的飞行员能打败它(人工智能)如果你知道你在做什么。当然,当你作为一个飞行员,尝试一些新的东西时,你可能偶尔被人工智能程序击落,但是,直到现在,一个人工智能对手完全不能跟上像战斗场景中的真正的压力和速度。


但是现在,已经训练了数以千计的美国空军飞行员,驾驶过几架歼击机并且毕业于美国战斗机武器学校(相当于在空中战斗战术和策略上高级学位的同等学历)的Lee,也和其他的飞行员一样感到了来自ALPHA的压力。


并且,更甚,当Lee在数小时长的模拟真实任务的时间里飞行对抗ALPHA,“我回家感觉筋疲力尽。我很累,耗尽了精力,感到疲倦。这可能就是人工智能,但是它代表了一个真正的挑战。”

 

 ◆ 

人工智能警告:人工智能战斗角色如何演变


Ernest解释说:“ALPHA已经是在这些仿真环境中要面对的一个致命的对手。我们的目标是继续发展ALPHA,推动和扩展它的能力,并且进行额外的测试来对抗其他受过训练的飞行员。保真度也需要增加,这将会变为更真实的空气动力学和传感器模型的形式。ALPHA完全能适应这些附加条件,并且我们在Psibernetix公司期待着继续发展。


长远来看,人工智能与美国空军能力协同合作将会代表一次革命性的飞跃。当今由人类飞行员进行的空战是一个高度灵活的应用,结合了航天物理、技能、艺术和直觉来操控一架战斗机和导弹对抗敌人,所有的移动都是高速的。毕竟,今天的战斗机以超过每小时1500英里的速度飞行在海拔4万英尺以上时以彼此接近。一个微秒的问题,产生错误的代价是非常高的。


由于ALPHA的运算速度已明显快于其他消费产品级基于语言的程序,其最终目的在于降低出错率。事实上,ALPHA能够读取并整理全部的传感器数据,创建一个模拟战斗情景,并为四台战斗机的博弈模拟作出决定,而这一切的最终用时不会超过千分之一秒。基本上,这个AI能够在250分之一眨眼的时间内,对动态环境做出最精确的回应并做出最佳的战略决策。


所以未来的空战如果需要超越人类能力的反应时间,将需要整合AI僚机 -- 即无人战斗机。这些AI僚机将能够在空战中配合载人战斗机,而其内部的机载战斗管理系统将能够处理态势感知,决策反应,选择战术,管理武器等等任务。所以,像ALPHA一样的AI可以同时躲避几十颗敌方导弹,对多个目标进行精确射击,配合队友的反应,同时从观察敌人的战术和能力中记录和学习。


辛辛那提大学的科恩补充说,“作为队友,ALPHA将会是一个非常容易合作的AI 。它能够不断地以最佳的方式执行它的载人僚机分派的任务,并给其余战斗成员提供战术和实地建议。”


 ◆ 

编程的胜利:低计算功耗,高性能结果


人们通常会觉得,人工智能若具备如ALPHA如此的学习能力与性能,又能够解决难以想象的复杂问题,其将需要一个超级计算机来运作。


然而,ALPHA和其算法在实时运行中所需要的计算能力仅需要一台廉价的PC,遍足够使其迅速对不确定性,随机事件和情形做出响应。


一位美国空军研究实验室的首席工程师说道,“ALPHA显示出令人难以置信的潜力,它所具有的高性能和低计算成本是无人机战队进行复杂协同作战的关键。”


大约在三年前,欧内斯特与辛辛那提大学工程学院的成员科恩开始着手解决计算能力的难题,当年他还是一位博士生。(2011年欧内斯特获得了辛辛那提大学航空航天工程和工程力学的本科学位,2012年他获得了辛辛那提大学的硕士学位,也是在航天工程和工程力学领域。)


他们使用基于语言的控制(而非数字化控制)与“遗传模糊树”(GFT)系统,即一种模糊逻辑算法的亚型。


辛辛那提大学的科恩指出,“遗传模糊系统的高性能已被证实,在此系统下一个具有四个或五个输入变量的问题可以轻而易举得到解决。但是,如果有一百个输入变量,除非问题和所有输入变量被分解为一个一个的副级决定,目前地球上还没有任何计算系统能够解决处理这个难题。”


这也是遗传模糊树系统与科恩和欧内斯特多年钻研成果的起到作用的地方。


Earnest说道:“简单解释起来,遗传模糊树系统与人类解决问题的方式比较接近。举个例子,橄榄球接球手依据掩护他的侧卫来评估如何调整自己的打法。接球手并不会自己这样考虑:“在这个赛季中,掩护我的这个侧卫总共有三次断球,断球后的平均返回距离为12码,两次失球,一次4.3540码冲撞,73次擒住并将对方带球球员摔倒,14次辅助摔倒,只有一次传球干扰,五次传球被防,他今年28岁,现在距离第三场还有12分钟,他已经上场825.3秒。”


那个接球手仅仅考虑这个侧卫“非常不错”,而不是在比赛之前站在争球线上回忆各种统计数据,思考它们的意义,并将其结合起来,从而改变他的战术。


这个侧卫的历史成绩并不是唯一的变量。他的身高和速度也需要作为考虑因素。因此,这个接球手的控制决策可能又快又简单:“这个侧卫非常棒,比我高很多,但是我比他速度快。”


在最基础的层面,这就是分布式计算能力当中的概念,也是遗传模糊树系统的基础。否则,如果只依靠单独控制因素,场景或者决策将要求非常多的规则。


Ernest补充道:“作为我们人类来说,完成复杂任务的关键在于每做一个子决策只考虑相关因素。因此,人工智能也可以通过同样的方式来做。”


在这种情况下,这项编程涉及到在飞行战斗部署中将复杂问题分解成若干子决策,从而大大地减少有效解决方案的“空间”和负担。决策树的分支或子决策由高级战术、开火、规避和防御组成。


这便是遗传模糊树系统中“树”的部分。


 ◆ 

基于语言的、遗传学的迭代式的程序


大部分人工智能编程使用基于数字的控制,同时需要提供非常精确的参数以供运行。换句话说,这种程序对于编程方面的改进或者情境决策没有太多的*空间。


Ernest和他的团队最终开发的人工智能算法是基于语言的,利用if/then情景和规则能够包含成百上千的变量。这种基于语言控制或模糊逻辑的程序,尽管没有基于数字的程序那样复杂,但能够被验证和确认。


语言控制的另一个优点就在于专业知识能够容易地被系统接受。例如,LeePsibernetix曾一起以直接植入的方式为ALPHA提供战术和可操作性的建议。(这种“植入”方式是通过输入规定的术语到模糊逻辑控制器中实现的。例如,距离目标的远近;if/then规则相关的术语;以及其它的规则和详细说明)


最后,ALPHA程序是迭代式的。它能够迭代升级,不断有新版本。事实上,目前的APLHA的版本只是当前的版本,后续版本有望显著地表现更好。


再有,来自辛辛那提大学的Cohen表示:“在很多方面,它与一战中空战开始时没什么不同。最初,有一大批飞行员。那些在战争结束时幸存下来的人便是其中的佼佼者。只有在这种情况下,我们才开始谈代码这一回事。”


要达到它现有的性能水平,ALPHA的训练平台是售价500美元的面向消费者群体的个人电脑。训练过程始于大量随机选用的ALPHA版本。这些自动生成的ALPHA版本在与手动调整的版本对抗中,证明了它们自身的实力。接着,这些获胜的代码串互相培育,有利于产生更强或更高性能的版本。换句话说,只有表现最好的代码才会应用到后续版本中。最终,以性能来看,会出现一个最高水平的ALPHA版本,这正是会被使用的版本。这就是“遗传模糊树”系统的“基因”部分。


Cohen说道:“所有这些因素结合在一起,包括树状级联、基于语言的编程和各代版本。

用模仿人类的推理而言,我觉得对于无人机而言,就像是IBM的深蓝在国际象棋上和卡斯帕罗夫的对阵一样。”


 ◆ 

资助与支持


ALPHA是由Psibernetix公司研发,该公司为美国空军研究实验室的承包商。戴顿地区研究生研究机构和美国空军研究实验室在过去三年向Ernest的博士研究提供了共计二十万美元的资助。


上一篇:渡一 9-1预编译&作用域&闭包


下一篇:App Push系统(3)--推送服务