回溯到两年多以前,在“我是歌手”的舞台上,阿里的AR开启了走出阿里巴巴集团、走向产业化的道路。同时随之而来的是一个问题——阿里的智能究竟该怎么做?大家可能已经从屏幕上看到了答案,那就是两个字——大脑。
从城市大脑、工业大脑、环境大脑、航空大脑,到刚刚*裁演示的农业大脑,智能之梦已经从钢筋水泥的超大型城市走向了遥远的边区、走到了农村的土地上。在梦中,每一寸土地的价值都能使用数字化手段进行量化。在这个数字化和智能化的过程中,阿里起到的作用不仅仅是帮助用户上云,更重要的是帮助用户了解上云之后应该干什么,在云上发生了什么。如果客户的数据仅仅是在云上存储,那么这离智能化还远远不够。今天将带领大家来透视一下“大脑究竟是如何炼成的”。
在各个大脑的背后,必然有很多的工程师在默默地工作着,他们都秉承着一个理念——知行合一。阿里的目标不仅仅是让每一个企业主、每一个工程师、每一个养殖专家做到知行合一,更希望让城市里的每一个信号灯、每一个地铁售票机也做到知行合一。中国有句古话:亡羊补牢,未为晚矣。但是在高度节奏化、碎片化的现代化社会,亡羊补牢所带来的后果是大家所不能接受的,我们更需要在亡羊之前就进行补牢,因为任何的等待都需要消耗时间成本和未来的机会成本,任何一个滞后的响应都可能对企业造成不可挽回的损失。
在刚刚的闪电立方的介绍中,分享人演示了一个pb级别的数据如何快速地上云,在上云之后,如何由大脑进行承接,使其做到知行合一。但是在知行合一的背后,有一个共性始终贯穿于三个产业线之中,这个共性就是数据产品。假设客户拥有着一个pb级别的数据,包含了所有相关生产数据,如果这些数据仅仅是被记录下来作为事故发生后的追查材料,那么这些数据包含的价值并没有得到真正地释放。数据蕴含的真正价值极其庞大,正如下图中所说的那样,数据将是驱动智能未来的新能源。
在历史的长河中,古罗马拥有众多城市,堪称世界之都,但是随着时间的流逝,现在它留给我们的只剩下无穷的念想,其价值没有经受住历史传承的考验,因为它没有将数据传承下来。到了18世纪初,Bernoulli家族意识到了这个问题,其中的一位杰出数学家更是大胆地进行预判,未来的社会必然会被海量的数据所淹没,并提出了一个著名的定理——大数定理。今天人们所说的大数据,在某种程度上都源自于这个公式。到了1948年,Shannon基于前人的研究创建了信息论,并提出了熵的概念。然后在1973年,日本的一位著名的统计学家Akaike提出了AIC信息准则,创建了用于从海量的数据中提取最有价值信息的模型,如果没有这个模型,我们现在将被pb、tb级别的数据所淹没。
在处理pb、tb等高级别的实时数据时,如何将数学理论和云计算能力相结合,创造无以计算的价值,是一个难以解决的问题。首先肯定不能像“小作坊”一样的去寻找数据,而是需要创建一条现代化的生产线,因为仅凭手工作坊是无法修建出通向未来之路的。在各个大脑的背后,有一套面向主体的数据操作系统,用于对数据进行处理。人们常说,数据是一种新能源。事实上也确实如此,数据实际上是一种高度可再生的资源,它不像撒哈拉沙漠中的石油,用一点少一点,数据每天都在产生,其价值瞬时即逝,所以数据是一种高度可再生的、价值及其稀薄的资源。因此想要从数据中提取价值,需要无与伦比的计算能力和计算方法。
数据增殖反应堆就是为了解决上述问题而提出来的。提到反应堆,人们首先想到的是核电站的反应堆,其输入是原材料,最后的输出是电力。同样的道理,数据增殖反应堆也能够提升数据的价值密度和价值效率。因为有产品,用户可以深度挖掘数据的价值,出现了隔代遗传和代代相传的现象;因为有产品,挖掘使用、在线调用的速度得到了极大提升,最终使得数据的价值密度增殖十倍,价值效率提升一百倍。
数据平台的核心能力体现在以下几个方面。一、它是全球首例城市五维实时数据融合;二、城市数据治理成熟七度模型;三、六大知识领域图谱;四、运行时做到零脏数据。
在这个平台上阿里提出了数据DNA的概念。当公共数据被看做为一个生命体时,其彼此间的逻辑结构便可以被看做是化学链接。如果在上层的应用出现异常,平台能够精准的追溯到出问题的数据源。目前已经实现了数据资源平台的响应时间小于1s,无论是城市大脑、农业大脑,还是工业生产线的大脑,当上层应用出现异常时,平台会在1s内精准锁定出问题的数据源和其所处的层次。
在今天,数据资源平台被部署到了企业的厂房和城市大脑,已经实现了标准化、集约化和规模化。因此,工程师们再也不用在高温机房内一边挥洒汗水,一边编写代码,而只用简单的在平台上进行点击操作。
下图的城市数字规划平台是和中国城市数据规划研究院联合研究推出的。从之前的“软”的角度进行规划,到现在“软硬兼施”地指挥城市的每一个城区的规划、迭代和生长。城市规划的方案再也不是靠经验堆出来的,而是靠平台计算得到的。每一寸土地的使用、每一层高楼的搭建对周边的影响都可以经由平台计算和量化立即得到,而不需要等到使用、搭建完成之后再进行测量。
如果将一栋建筑进行拆解,它会被拆分成钢筋水泥等元素,但是透过其表面对其进行研究,可以定义出它的基因。在全中国300多个城市、470万个地块,平台都实现了对其多维度的描述。有些维度甚至在实时更新,如人口的热力图、交通压力图等。描述中既有静态的指标,也有实时的指标,城市作为一个生命体,被彻底的解构,再也不是靠有多少栋高楼、有多少个停车场来进行浅显的描述。
此外,我们做到了体征的实时响应和探查,即通过摄像头监控街道上发生的事件和异常,并通过数据分析该异常产生的原因,做到“实时诊断,秒级响应”。在以往的应急响应中,大都是通过民警的预警或周围居民的报警,而在今天,这个报警的任务被交付给了这个平台。
一座城市的发展离不开经济,同样的道理,区域经济大脑的背后也离不开生产数据、交通数据、能源数据和环境数据。在将这些数据融入经济数据模型、产业链、产业带进行转移和变迁的时候,摒弃了以往人工普查的方式,实现了一键点击,智能查询。
该平台不仅适用于城市规划,也同样适用于企业。当一家企业经历了不同年代、使用了不同的数据库时,会产生一个痛点——各种数据库的规格、各种数据采集的手段和字段都没有传承。这些企业希望存在一个统一的资源库,并能实现数据的增殖反应。在以往,无序的数据就像下图中的电线一样杂乱无章,但是今天借助于Dataphin,可以做到有序数据的实时汇集和传承,最终实现工具化、自动化、智能化、价值化。
目前看起来似乎智能之路是畅通无阻的。有了这么多的先进的数据产品,智能社会似乎伸手可及,但是此时此刻所有数据的产生和计算,都是在机房这个基础设施中进行的。如果我们有非常先进的产品,但是对机房的调度方式却十分原始的时候,是无法实现智能化的。这种身在20世纪,使用19世纪的理念来实现21世纪的梦想的历史错位是行不通的。
在今天,全球的云计算数据中心运行着百万级别的服务器,而这些服务器的平均使用率只有6%到12%,这造成了极大的资源浪费,因此如何使用智能算法提升其资源使用率是一个极大的挑战,让云上的用户能享受更高效、更低成本的服务,让全社会的基础运算设施更节能、更环保、更高效。
走向智能之路,既要从人才抓起,又要从产品抓起,也要从基础设施抓起,这三者缺一不可,这也是整个科技从业者整体的梦想。1982年斯皮尔伯格的电影《ET》中有这么一句话,外星人看地球时,觉得他们的智能十分低等。但是现在,在地球上,还有另一个ET的存在——ET大脑,今天可以将所有思考的因素和基因注入到万物之中,让每一个生物体、每一个基础设施都具备思考的能力,这样智能社会的到来也将不再是一个梦想。
让我们一起奋斗!