10月12日,阿里云机器智能首席科学家闵万里在2017杭州·云栖大会上表示,人工智能以往是单点呈现,未来要做的是串联单点技术,不断进化成多体多能。
闵万里以工业生产为例,假定一条流水线有ABCDEFG环节,产品H。每一个流水线工人的操作都可能有偏差,之后的环节如何实时纠正,最终保证产品的核心H质量稳定。这种协调不是事后的分析,必须依靠在线、实时的反馈,这就是单体单能到多体多能的转变。
ET城市大脑在杭州萧山帮助救护车节省50%的时间抵达现场,证明了多体多能的可行性和可达性。
靠救护车鸣笛闯信号灯的制度存在几十年,阿里云之所以要挑战它,因为它依赖太多不确定因素,比如堵车等,依靠阿里云从底层的计算平台、数据平台,到上层的智能技术,包括视频识别、人脸识别、OCR、文本识别、语音对话等,就可以对科技作有情怀的组合,为每个老百姓多争取50%的救援时间。
闵万里最后总结,阿里云不满足只做单点的智能技术,这些智能技术不是终极目标,多体多能,让科技普惠每个人才是。
以下是闵万里演讲全文:
大家早上好!这世界上最令人绝望的等待就是在急救车上,结果急救车无法及时的赶到医院。最无情的信号灯就是一路给救护车红色的信号灯。
刚刚大家看到的这样一个视频,其实背后凝结的是非常多的人工智能的技术,不仅仅是人工智能的技术,还有今天我要给大家讲到的多体智能。
要做到这样一个全城的绿色信号灯给到每一个等待拯救的生命,这背后不仅要有情怀,普惠的情怀,也需要有技术的实力。技术上是否可行?
给大家讲一个故事,1900年的时候,经典的物理学已经非常完美,牛顿力学三大定律,麦克斯韦方程组,圆满解释所有物理学的现象,除了两个令人不安的试验。
有人对这个现状不满意,第一个人就是爱因斯坦,第二个人就是波尔。大家都知道爱因斯坦广义相对论、引力波,诺贝尔奖。波尔量子论,量子力学、量子计算。
今天我们要讲的是同样的一个故事,当我们今天有了这么多非常厉害的视频识别、人脸识别、OCR、文本识别、语音对话的时候,我们是否就可以轻松的解决刚才讲到的一路绿色的生命通道?答案是不是那么简单,它有很多技术的挑战。
就像这张图大家看到的,每个单个的原子代表人工智能的技术,人脸识别、语音对话。第一个挑战就是怎么把这些分散的技术有机的结合在一起成一个功能台,叫单体多能。
就像我们生物的进化从单细胞到功能台一直到今天强大的哺乳类动物,人类一样,这是进化的过程。
有了单体的多能还不够,当许多个单体一起竞争的时候,怎么让这个系统变得智能?像救护车的场景,有电瓶车跟他抢,有公交车跟他抢,还有闯红灯的人跟他一起在抢的时候,怎么样让所有人都能够听到绿色的信号灯的呼唤,主动的让开一条路而不是靠以往的那种鸣笛,开到最大还有人置若罔闻。
这样在一条进化的道路,从单点的单功能到多体的多能之间的有机的协调。这条路通吗?这条路很难,可以跟大家说。为了做萧山的案例花了一年的时间,但是至少我们证明一件事情:可行性、可达性。
这一条路怎么走过来的?千里之行始于足下,肯定首先在基础性的功能做到极致。就像今天大家的视觉、视频、人脸识别已经在城市大脑当中用起来,精准的量化每一个路口左转的车辆有多少辆,右转的有多少,直行的有多少,不是统计数据。精准的识别车的类型,帮助城市做交通政策的研判,做实时的排堵,这些都是视觉上已经做到的。
同样的道理,我们讲的语音识别上,可能大家也看到新闻,我们在法院的庭审当中已经做到语音直接转到文字上面去。还有我们在武汉我们做到给每一个外来的游客通过语音交互的方式做智能的问答、智能的推荐,这些都是已经落地的单点的智能。
还有刚刚提到的,让数据可视,其实不仅仅是可视,而且可解读,究竟从360度哪个视角看才能了解城市发生什么,或者高楼怎么建对这个城市有什么影响,这个问题回答,要从多个数据源多个角度探索。以往做规划、测绘的时候靠软件靠CAD非常的慢,甚至还有可能无法做到数据的叠加,但是今天通过这些黑科技,已经可以做到。
而且我们不仅做到可视,还可以做到什么?还可以做到把这些数据放在一起,聚合不同类型的数据在具体的场景,比方消防、安监、绿色环保等等环境污染监控,在这些上面做多种数据的实时融合,及时的发现哪一家企业的排废是有问题的,及时发现哪一个消防重点单位有可能出问题,我最近的消防车在哪里,需要升降云梯到多少层以上才能急救这样一个火灾。
这些决策都是秒级之间完成,要做到这一点还是需要数据的实时聚合。
但是这些可能大家都觉得说我们已经有了非常厉害的先进的管理理念和体系制度,不错,在先进的理念的基础上,还需要技术的赋能。一个好的理念和一个坏的执行之间是产生不了一个成功的结果,产生不了普惠的价值。
我们怎么能够做到在单点多能之外做到多体多能,这件事情怎么做?
其实给大家看这样一张图。这个抖动的图我想来解释一下,假定说你有一个流水线,ABCDEFG,最后生产出来的是H,H是你的产品,每一个流水线上的工人们,他们的操作,都有可能有一些偏差,当他们有偏差的时候,后面的人怎么样的实时纠正,最终保证的这个图当中最核心的就是这个H是不动的,任它风吹雨打这个船始终在稳定着。
产品的质量是稳定的,生产的效率是稳定的,良品率是稳定的,怎么做到,就需要前面的ABCDEFG有机的协调在一起,这种协调绝对不是事后的分析,做报表才能够做出来的,一定要在线实时反馈。
这样一种理念,我们用到哪里?用到了恒逸集团,昨天晓明总讲到的,燃煤过程中吹风的过程中,吹风的时间,把煤吹起来,吹煤的速度,太快了没有燃烧充分,太晚了效率下降,一环扣一环像ABCDEFG我们怎么动态调解,确保生产出来电的效率是最高的。排的污,废气,没有充分燃烧的硫是最少的,我们都做到了。这都是单点单能,多体多能的案例。
萧山的案例。这张图信号灯的沉默,它听不到信号灯的声音,它两套*,只能在左转车道等红灯,哪怕它有特权也飞不过去,这种令人绝望的等待怎么让技术带来新的希望。
大家可以看到,这里面最难的是什么?最难的其实就是每一个人,每一个司机,可能都有自己的利益诉求。都是一个非常聪明的人,都能够杀出一条血路快速到公司上班。
这种情况下,怎么从全局的角度让最有优先级的人,最需要时间的救护车及时的过去,重点就是中间的环节,让每一个路口的信号灯在提前几十秒为他开通绿色。那么要精准的知道它几点几分会到达这个路口,它会到哪些路口,提前规划。
今天我们做到的,刚刚视频当中也提到,我们压缩了这个时间50%。至少多了希望是50%。那50%的时间,带来的是生命的挽救,这个价值其实是真的无法衡量的,是一种普惠的结果。
这只是一个多体多能的一个样板,一个试点。在这个体系当中我们调动了120实时的语音NLP分析,解析出去到的地方,送到的医院,以及沿途之间的路径,这是第一点。第二点迅速的规划出在沿途每一个关键节点到达的时间,然后据此调解信号灯,这是第二个节点。
第三个节点要把整个的路径动态的下发,下发到急救车的司机身上,下发到交通信号灯指挥中心的身上。还有一点就是医院的急救室,几点几分到达急救室,需要什么样的设备,需要什么样的药物,所有的这一切不仅是自动化的结果,更是智能化的结果。差一分一秒就是信号灯周期好几分钟,有可能造成无法想像的后果。
这是一个高效的多体多能的一次演练,一次实战。
这个过程是怎么完成的?为什么我们能够做到或者敢于挑战大家都已经习以为常的一百年的制度,靠信号灯,靠救护车的鸣笛声去闯信号灯,这个制度存在几十年了,为什么今天要挑战它?
因为它不完美,因为它依赖太多不确定的因素,因为有这些产品,多体智能的路标,底层计算平台到数据平台,刚刚提到的one data,还有存储器,都是底层的黑科技,把黑科技有效的组合有情怀的组合,带来的就是普惠的价值,让每个老百姓,让每个城市的绿色的生命通道畅通50%。
这只是一个开始,刚刚尝试。
大家看这一张图,有可能我们做的今天就是这个雪地上的一串脚印。看起来非常的优雅,带给你的是诗和远方,但是春暖花开的时候雪慢慢的熔化,这一串脚印慢慢的消失,一切都成为一种传奇。但是右边的那张图片,人类在月球上的第一个脚印,48年了还存在着。
一个很深的雪地上的脚印也是一种创新,一种突破,给了大家想像的空间。但是那么浅浅的一个脚印在月球上,给了人类一个大步,给了我们一个无穷的想像的空间,探索宇宙,爱因斯坦没有满足四大力学的经典,他创造了宇宙学当中的引力波、广义相对论,今天同样的,阿里云我们也不满足于只做人工智能当中视频识别、语音识别还有文本识别,这些我们都可以做,但是这不是我们的终极目标。我们的终极目标在哪里?
多体智能、普惠,让所有的人不再依赖于一种强行的制度或者侥幸,找到它急救的医院,让每一个急着赶往学校里面接孩子的家长,能够早一分钟看到家长。让监管部门能看到每一个危化品车辆实时的路径、目的地,沿途要经过的路径。
然后还有最重要的一点,让所有企业用户在数字化转型的过程中,你得到的不仅仅是一个存储的成本的降低,更重要的是你有增值,数据智能的增值,这一切都是有可能。我们先驱的脚印,阿里云的实践已经证明这个事情的可行。
那么今天我想给大家传递的信息很简单,如果我们一起前行,一起往这个方向走,走往多体智能的道路,今天创造的就不仅仅是萧山的绿色生命通道,我们创造的可能是中国的每一个城市,每一个区里面都有这样弹性的绿色通道,最后得到的一个无法计算的价值,我们讲到的阿里云的Slogan。