“企业认识到数据是企业有价值的资产,不可能把我的数据分享到云上去,这是现在企业应用人工智能方面的通病,所以在谨慎迎接AI又在防着AI。”
2018年10月31日,中国科技开发院大数据与人工智能研究院首席科学家张世明在NEXT·AI中国龙华智能产业(人才)创新峰会上分享时表示,我们需要实时计算结果,需要减少反应时间,需要一个可靠性的系统,并且在线和离线地运行,需要安全合规地分离。
同时,张世明认为企业觉得数据资产是一种有价值的资产,所以把数据看得非常重要,而忽略了企业数据真正存在的现状。现在很多企业数据是混乱的,数据之间很难打通,包括一个企业内部。从这个方面,目前的数据管理、数据运营各方面都比较低效。
在他看来,智能制造是人工智能重要的落地场景之一,工业互联网是未来的大趋势,需要所有的设备、管理、流程数字化,需要在数字化基础上把数据流通起来,需要把数据变成生活生产。未来人们将以协作为中心,进行多方计算,从中心化架构到分布式架构,结果是存在多融合的、去中心化的融合架构。
张世明表示,人工智能技术应用的开发过程中,重要的一件事不是做模型的开发,而90%的工作是做数据的预处理。要把ET科学家放在工厂,而不是坐在实验室,因为必须把算法与实际的应用场景紧密结合,实验室理想环境中的算法与实际环境相应的算法是脱节的。
资本在人工智能方面做了很大投入,并且带来了技术方面的升级和进步,但张世明认为现在AI的技术发展水平远远没有达到想要的需求。目前AI没有意识和物性,缺乏综合的决策能力,这是现在人工智能所面临的一个重要问题。
张世明演讲实录:
对于人工智能现在的发展来说,我们远远没有达到我们自己想象的一个结构,特别是针对阿里云的发展、针对ET大脑的发展以及百度、腾讯这些巨头方面在人工智能方面的大力投入以及还有很多资金特别是资本在人工智能方面的投入上做了很大的投入,并且带来了技术方面的升级和进步,但是我们现在AI的技术发展水平远远没有达到我们自己想要的一个需求,所以我说现在的AI需要涉及到方方面面的一个技术发展。
在此,我首先需要澄清一点,就是说什么叫人工智能,大家天天都在讲人工智能,特别是人工智能给我们生活带来了很大的方便,我们现在可以通过人脸完成自己的手机支付,特别是支付宝,我们通过刷脸把我们的现金花出去了,但是我们仍然没有任何感觉。
在此,我必须澄清一点什么叫人工智能,人工智能从这个概念出来也就五六十年的时间,但是针对它的内涵来说,就是从机器模拟人类智能,这是一个很宽泛的概念,说我们也不知道这个人工智能到底能干什么,我们只是想通过机器的方式能够模仿人类的思维方式。
这只是一个初步的定义,如何把人工智能跟现有的一些生活和现有的技术进行结合呢?特别是现在针对人工智能,大家谈的人工智能就是说利人行动的系统、利人思考的系统以及一些理性思维的系统,是不是能够通过图灵测试、是不是能够使机器、使我们的生活机器能听会说,能听懂我们说的话,能够看懂我们写的内容,能像人一样的学习、能像人一样控制我们自己所有的思维方式,针对事情的变化而做出相对应的决策,所以这是语言,我们涉及很多技术方面的发展。
因为人工智能涉及计算机科学所有领域的技术,涵盖了内容,包括自然语言处理、视觉处理等,还有现在一些相关最热的自动驾驶,包括AR/VR等,所有这些人工智能所涵盖内容的一部分,所以我们并不能把人工智能妖魔鬼怪化。现在的人工智能依然有很多局限性,特别是我们现在人工智能,特别是我们能够人脸识别,人可以达到98%,人人可以进行的人脸识别,还有语言,我们说的每句话都可以实时翻译成我们的文字,把中文、英文包括阿拉伯文以及日文都可以进行相应的翻译,但是我们可以知道我们的机器只是有智商没有情商,不能反映我们现在这个人的状态而做出相应的决策,我们这个机器人只是有智能,没有智慧。
也就是说,我们有意识,就是它没有意识和物性,缺乏综合的决策能力,这是我们现在人工智能所面临的一个重要问题。我们的机器会计算,但是不会算计,为什么呢?人工智能系统可谓是有智无心,我们更没有相应的谋略来做出相应的环境变化而做出相应有效的变化,我们的人工智能只是在专业方面做出了很有效的一些决策,而不是一个通才。我们的机器AlphaGo会下围棋,但是我们不能在下围棋的角度上让它下象棋,这是一个永远不可以做到的事情。
在人工智能方面,现在各个方面的发展来说,在技术进步只是在这个视觉、在语音、语言和知识图谱方面做了一些相应的工作,应用了机器学习和一些重要的算法来改变我们传统行业和我们一些传统意义上AI人工智能方面的一些问题做了初步有效的发展和利用,但是与我们实际需要的人工智能还相去甚远。
在这儿我们可以区分出两个概念,大家都在讲人工智能,大家都在讲人工智能是什么样子,实际上我们的人工智能是什么样子,这要区分出弱人工智能和强人工智能的概念。实际上我们现在讲的作为人工智能只是弱人工智能,我们与强人工智能还相去甚远,甚至我们还没有实现,我们只是在哲学存在强人工智能,而我们现实生活中和现有的人所想象的人工智能是强人工智能,这就是为什么我们在具体的AI应用开发过程中,我们绝大部分的AI项目特别是企业AI的项目会失败,一个失败的重要原因是期望的不同对认识的不同,我认为我的机器做任何事情,恰恰相反我们的机器只能做局部的部分,所以人工智能任重而道远,需要长时间的发展。
尽管我们有了ET大脑、尽管我们有了所谓的人脸识别、所谓的图像识别包括猫脸识别各种方式的发展,但是我们还有长远的路要走。特别是人工智能,我们的鼻祖说了这样一句话,就是他依然不承认把人工智能和机器学习牵涉在一起,因为他否认人工智能已经发展到现有的发展程度,就是人工智能远远没有达到我们自己想要的需求。
人工智能是一个多学科的概念,它涉及到计算机学科方方面面,重点来说我们可以知道现在人工智能就是机器学习,就是自然语言处理,就是耳熟能详的深度学习。恰恰相反,我们所有这些内容只是我们人工智能范畴中的一部分,当然这个图并不是说很完整,有可能是某一个层面来讲,我们之间人工智能和机器学习以及与自然语言处理、深度学习,现有我们所有熟悉的人工智能算法和架构方面、各个方面所熟悉的一些关系。
我们这边涉及到一个人工智能和人类智慧之间重要的一个不同的问题,我觉得一个最重要的问题是在我们之间一种创造性的问题,我们的机器可以有智能,但是它永远不可能像人类一样进行文学创作、进行达到雅致的一种翻译,它只是把我们现有的人类有说过的一些内容进行相应的匹配,找到一个最相应的结果来回答你,现在的人工智能仅仅做到如此,而不可能做到相应的创造和推理。
当然,我们讲了那么多的人工智能,在人工智能现在来讲,有大数据,有区块链,又是云计算,又是物联网,又是移动互联网,但这些究竟有什么关系呢?我们所有讲人工智能,我们永远不可以脱离这些事物来进行单独的讲一个人工智能的事情,所以我们讲的人工智能必须涉及到大数据,我们一定会涉及到云计算,一定会涉及到物联网,我们一定会涉及到现有的物联网。
人工智能,现在大家都认为我们已经进入到人工智能时代,我们渠道智能化。我们的人工智能驱动了人类社会进入第四工业革命和第二次信息革命,特别是大数据的发展促进了我们大规模机器学习算法的一种发展。结合着区块链以及人工智能促进了我们智能化应用在生活中方方面面的应用,帮助我们人类和相应的生活做了很大的便利和企业、组织管理以及各个方面业务的发展,有很大的促进作用,所以促进了我们人类进入下一个工业革命的阶段。
当然讲人工智能,我们不能脱离网络技术的发展、不能脱离Web的发展,只有这两部分的技术的促进才能促进人工智能的发展,因为我们需要生活中方方面面的数据来促进这台机器如何从各个方面的数据找出自己想要的数据结果。
人工智能的应用是智能时代变革的核心力量,现在的人工智能在我们的生活中已经体现在方方面面了,我们的手机、我们的出勤、我们不用再为了走哪条路线而做相应的像二十年前需要查各种交通路线怎么来龙华、怎么去北京,而我们现在只需要一个地图,并且我们人工智能在各个行业也产生了重要的影响,特别是在刚才我们讲的ET大脑在各个方面一些行业包括智能交通、城市各个方面都有巨大的影响,对我们的生活产生了很大的便利,并且提升了我们自己的生活品质。
然而,大家觉得这个工作是非常重要的一件事情,我们应该有相应的算法开发,这是大众理解人工智能一个重要的任务,恰恰相反,我们人工智能模型的开发大家认为是最重要的一件事情,而在我们实际生活中是很小的工作。因为现在人工智能技术应用的开发过程中,我们需要做重要的一件事情不是做模型的开发,而90%的工作是做数据的预处理。这就是刚才说把ET科学家放在工厂,而不是坐在实验室,因为我们必须把我们的算法与实际的应用场景紧密的结合,我不能把我们的算法在我们实验室的理想环境中与我们实际的环境相应的脱节。
我们把人工智能发展很好,发展动因在哪里?我们主要在三个方面,一个是互联网的发展促进了我们数据容量大量的累积,我们生活中方方面面的数据,可以累积到我们的数据,可以反映到生活中的方方面面,可以使我们人工智能的机器发现和检索到相应我们需匹配的一些数据内容。
第二个方面就是说我们有了数据,我们如何把我们的技术变成一个有效的结果,这有效的结果必须有强大的算力,机器的发展推动深度学习,深度学习推动了相应巨大模型的出现,事实这个巨大的模型可以拓展到某一个具体问题的方向。以前在算力不足的情况下只是把算法处理相应的简单问题,这个算法只是做简单的事情,而随着大数据的发展,分布式系统的进步使我们的算法可以运行在一个像ET大脑这样一种环境之中,这样才能达到人工智能应用一种可行的环境。
从数据的角度来讲,我们在未来的结果会是什么样子呢?我们毫不疑问,就是说我们的数据会进行指数级的增长,可以想象我们的数据是非常大,包括我们现在所有的生活、包括我们的图书馆,我们可以想象每一个图书馆的容量是非常大的,而现在对于我们的一个图书馆来说,只是我们现在一个硬盘就能保持到所有图书馆的信息。在未来的十年或者是十五年范围之内,我们的数据会发展到什么样的程度呢,我们可能有十倍的增长,这只是一个数据,但我想象可能比这个数据更大。
我们从传统的数据库时代走进大数据时代,在大数据时代,随着大数据的发展、人工智能的发展以及数据智能技术进一步的深化,我们知道我们未来会走一个数据智能的时代。这个方面,我们讲了现在我们把这个数据阶段分成不同的阶段,到现在我们处在一个大数据时代,我们累积了很多数据,我们数据重要特征是变化非常快,我们需要实时计算,把现有实时场景得出实时结果,所以我认为这是一个快速发展时代。
针对我们的算法、针对我们的系统提出巨大的挑战,我认为未来除了存储环境的需求,我们最终的结果是需要一种智能,我们需要一种知识结果出来,而不是需要一种传统数据的结果,所以未来的结果,我觉得是一种洞察数据时代的结果。未来的结果,我们觉得超过25%的,特别是2015年左右的,我们认为实时计算是一种重要的目标,95%的数据是通过互联网终端特别是物联网结构,因为物联网结构终端数量会比现有的手机会多很多,我们超过25%的数据将会关注生存安全。
我们想到所有现在的AI给我们只带来方便而跟我们生活没有任何的关系,我们可以看到一些人工智能可以在疾病诊断特别是肺癌、基因监测方面给我们带来很大的帮助,但是真正实际生活的帮助还是微乎其微的。虽然我们的视觉、我们的语言在分析化数据方面做出很大的贡献,但是源源不足以我们自己生活实际所需要的这种结果。
一个重要的原因是虽然我们人工智能很多落地,但在实际的开发之中、协议中都是失败的,所以很多人对人工智能产生了怀疑、对人工智能产生了疑虑,也是很多企业很关注人工智能但又怕人工智能的一个重要原因,是在于我们有企业觉得我们有数据资产,我们的数据资产是一种有价值的资产,所以我们把我们的数据看得非常重要,而忽略了企业数据真正存在的现状。很简单,现在很多企业数据是混乱的,数据之间是很难打通的,包括一个企业之间,大家都认为打通数据是很方便的一件事情。
恰恰相反,各个业务单元,除了现在数据质量特别好的,除了互联网企业之外,其他所有传统行业特别是智能制造想发展这些企业,它的数据现在情况是非常糟糕。如果你想应用这个时间把我们人工智能的技术应用到传统的行业来说,这个难度是非常大的,这就是为什么我们的ET大脑科学家要住到工厂,因为我们想梳理这个数据的现状是什么样子的,我们要理解它的数据是怎么样混乱,它的原因是在哪里。从这个方面说,我们的数据管理、数据运营各方面都是比较低效的,所以我们在人工智能方面还有很长的路要走。
人工智能的发展除了数据的积累,流量需求是非常大的一个重要基础之外,我们还有一个重要基础就是我们的算力要足够强。我们现在讲算力,我们讲云计算,我们讲我们有城市大脑,然而结果却不是我们需要的一些结果,实际应用过程中我们可能并不需要这些东西,我们需要融合的数据架构来进行人工智能的发展。
因为重要的问题是说企业认识到数据是企业的一个有价值的资产,而这个资产我不可能把我的数据分享到云上去,这是现在企业应用人工智能方面的通病,就是各个担心,也觉得这是很重要的事情,也觉得它是洪水猛兽,所以在谨慎的迎接AI又在防着AI的过程。因为我们需要一个实时计算结果,我们需要减少反应时间,我们需要一个可靠性的系统,并且在线和离线的运行,我们需要安全合规的分离。我们需要改造现有的人工智能架构,未来的AI,我们觉得AI+各个行业方面的应用是我们创新应用的典范,这就是AI为什么跟航空结合、为什么跟工厂结合。我们AI方面的应有必须跟传统行业某一个行业的应用结合在一起在于发挥到我们最佳的实际应用价值。
智能制造,我觉得是人工智能重要的落地场景之一,特别是除了现有比较火热的自动驾驶以外,现在讲到我们是工业互联网,而我们现在的工业大数据,而我们现在所有讲的大家很熟悉的AI都是在互联网,这是一个消费互联网,就是我们现在的人类消费互联网,而实际上我们工业互联网是未来的大趋势,这就是为什么需要我们所有的设备、管理、流程数字化,我们需要在数字化基础上把数据流通起来,我们得到数据需要流通数据,我们需要把数据变成生活生产。这是为什么智能制造特别重要的作用,就是个性化定制和智能合作的一个趋势,这是为什么德国提工业4.0、美国提消费互联网的事情。
在专用智能方面我们已经做了很好了,在通用方面还做的不够好,所以远远落后,所以现在有一个从专用智能到通用智能,从机器智能到人机混合,我们讲人工智能只是人工+智能的结果,很多方面我们需要标配数据、需要大量的人工做相应的智能工作来指导我们企业做相应的搜索。未来的科学也是学科交叉将成为人工智能创新源泉,我们脑科学的发展、类脑的发展以及各个方面的分布式在传统行业认知基础、心理学方面的发展来促进我们人工智能发展的一个重要思想源泉。
深度学习驱动人工智能的发展,但是我们有其局限性。这就是说到一件事,现在人工智能的一些科学家们深陷深度学习的泥团而不能自拔,因为深度学习解决我们一些问题,而不是我们人工智能要解决的一个核心数据发展,这不多讲了。
未来除了深度学习以外,我们需要强化学习,我们需要迁移学习,为什么呢?我们深入学习有大量的数据,而针对学习来说我们并不需要很强大的数据量。未来我们将是以协作为中心,我们需要多方计算。我们是从中心化架构到分布式架构的结果,结果是存在多融合的,去中心化的融合架构。
多模态的终身学习也是我们智能增强的必经之路,这是为什么我们需要把我们的数据分享给ET大脑、为什么把我们的数据积累到相应的AI应用,我们需要一个多次迭代的过程。未来的人工智能有效落地的一个重要路径就是我们需要我们的人工智能专家,我们需要我们的行业专家,结合在一起才能做出一个正确的成功的人工智能的应用,这就是为什么我们的数据科学家、我们进工厂、我们要进养猪场、我们要进入相应企业的内部来做这样一件事情。
当然,我给大家一个重要的问题就是人工智能在各个方面的一些应用,大家可以耳熟能详的一些应用,包括图像识别、语音识别、自然语言处理、智能制造、自动驾驶、无人机、AR/VR等等。大家想现在是把人工智能妖魔鬼怪化,实际上人工智能是一个真正的增强人工智能。