有人说,人工智能(Artificial Intelligence)是未来。人工智能是科幻小说。人工智能已经是我们日常生活的一部分。所有这些陈述都 ok,这主要取决于你所设想的人工智能是哪一类。
例如,今年早些时候,Google DeepMind 的 Alphago 程序击败了韩国围棋大师李世乭九段。人工智能、机器学习和深度学习这些词成为媒体热词,用来描述 DeepMind 是如何获得成功的。尽管三者都是 AlphaGo 击败李世乭的因素,但它们不是同一概念。
区别三者最简单的方法:想象同心圆,人工智能(AI)是半径最大的同心圆,向内是机器学习(Machine Learning),最内是深入学习(Deep Learning)。
从概念的而提出到繁荣
自从几位计算机科学家在 1956 年的达特茅斯会议上提到这个词以后,人工智能就萦绕在实验研究者们心中,不断酝酿。在此后的几十年里,人工智能被标榜为成就人类文明美好未来的关键。
在过去的几年里,特别是 2015 以来,人工智能开始大爆发。这在很大程度上提高了 GPU 的广泛可用性,使得并行处理速度越来越快,使用更便宜,而且功能更强大。整个大数据运动拥有无限的存储和大量的数据:图像,文本,交易,映射数据等等。
人工智能——机器所赋予的人的智能
早在 1956 年夏天的会议上,人工智能先驱者的梦想是建立一个由新兴计算机启用的复杂的机器,具有与人的智能相似的特征。这是我们认为的「强人工智能」(General AI),而神话般的机器则会拥有我们所有的感知,甚至更多,并且像人类一样思考。你已经在电影中见过这些机器无休止地运动,像朋友如 C-3PO,或者敌人如终结者。一般的人工智能机器仍然只是出现在电影和科幻小说中。
我们目前可以实现的还是局限于「弱人工智能」(Narrow AI)。这些技术能够像人类一样执行特定的任务,或者比人类做的更好。像 Pinterest 上的图像分类,Facebook 上的人脸识别等。
这些都是弱人工智能实践中的例子。这些技术展示了人类智力的一些方面。但如何展示?这些智力是从哪里来的?这些问题促使我们进入到下一个阶段,机器学习。
机器学习——一种实现人工智能的方法
机器学习最根本的点在于使用算法来分析数据的实践、学习,然后对真实的事件作出决定或预测。而不是用一组特定的指令生成的硬编码软件程序来解决特定任务,机器是通过使用大量的数据和算法来「训练」,这样就给了它学习如何执行任务的能力。
机器学习是早期人工智能人群思考的产物,多年来形成的算法包括决策树学习、归纳逻辑编程、聚类、强化学习、贝叶斯网络等等。正如我们所知,所有这些都没有实现强人工智能的最终目标,而早期的机器学习方法甚至连弱人工智能都没有触及到。
事实证明,多年来机器学习的最佳应用领域之一是计算机视觉,尽管仍然需要大量的手工编码来完成这项工作。人们会去写手工编码分类器,如边缘检测滤波器,以便程序可以识别一个目标的启动和停止;进行形状检测以确定它是否有八个侧面;同时确保分类器能够识别字母「s-t-o-p.」从那些手工编码分类器中,机器就会开发算法使得图像和「学习」更有意义,用来确定这是否是一个停止标志。
结果还算不错,但这还不够。特别是在雾天当标志不那么清晰,或有一棵树掩盖了标志的一部分时,就难以成功了。还有一个原因,计算机视觉和图像检测还不能与人类相媲美,它太脆弱,太容易受到周围环境的影响。
随着时间的推移,学习算法改变了这一切。
深度学习——一种实现机器学习的技术
放猫(Herding Cats):YouTube 视频抓拍的猫的形象是深度学习的第一次突破性展示
在过去的几十年中,早期机器学习的另一种算法是人工神经网络。神经网络的灵感来自于我们对人类大脑生物学的理解:所有这些神经元之间的相互联系。在一定的物理距离内,生物大脑中的任何神经元可以连接到其他神经元,而人工神经网络有离散的层、连接和数据传播的方向。
例如,你可以把一个图像分割成很多部分,这些可以输入到神经网络的第一层。在第一层中的单个神经元,然后将数据传递到第二层。第二层神经元做它的任务,等等,直到最后一层,那么最终结果就产生了。
每个神经元都为其输入分配权重,分配的权重正确与否与执行的任务相关。结果,最终的输出由所有的权重所决定。这样,还是以「停止」标志牌为例。将「停止」标志牌图像的元素抽离分析,然后由神经元「检查」:其八边形的外形,消防车火红的颜色,鲜明的字母,交通标志的大小,处于运动或静止的状态。神经网络主要任务是总结是否是个停止标志。随即,基于权重、经过深思熟虑「概率向量」的概念出现。该案例中,该系统中 86% 的可能是停止标志,7% 的可能是速度限制标志,5% 的可能性是挂在树上的风筝等等。这样,网络结构便会告知神经网络是否正确。
但这个例子还是非常超前。因为直到最近,神经网络还是被人工智能研究所忽略。实际上,在人工智能出现之初,神经网络就已经显现了,在「智能」方面还是产生很小的价值。问题是甚至最基本的神经网络都是靠大量的运算。不过,多伦多大学的 Geoffrey Hinton 领导的一个研究小组始终专注于其中,最终实现以超算为目标的并行算法的运算且概念的证明,但直到 GPU 得到广泛利用,这些承诺才得以实现。
回到之前「停止」标志的例子。神经网络是被调制或「训练」出来的,并且不时遇到错误的应答。它所需要的就是训练。需要呈现成百上千甚至上百万的图像,直到神经元输入的权重被准确调制,那么实际上每次都能得到正确的信息,无论是否有雾,无论晴天还是雨天。只有在那一点,神经网络才学会一个停止标志是什么样的,Facebook 上你妈妈的脸是什么样,又或者是吴恩达(Andrew Ng)教授 2012 年在 Google 上学习到的猫的样子。
吴恩达的突破在于将这些神经网络显著增大,增加了层数和神经元,并通过系统的训练运行大量的数据。在吴教授所举案例中,数据就是 YouTube 视频中 1000 万张图像。他将深度学习中添加了「深度」,也就是这些神经网络中的所有层。
通过在某些场景中深度学习,机器训练的图像识别要比人做得好:从猫到辨别血液中癌症的指标,再到核磁共振成像中肿瘤。Google 的 AlphaGo 先是学会了如何下棋,然后它与自己下棋训练。通过不断地与自己下棋,反复练习,以此训练自己的神经网络。
深度学习,赋予人工智能光明的未来
深度学习使得许多机器学习应用得以实现,并拓展了人工智能的整个领域。深度学习一一实现了各种任务,并使得所有的机器辅助变成可能。无人驾驶汽车、预防性医疗保健、甚至的更好的电影推荐,都触手可及或即将成为现实。人工智能就在现在,也在未来。有了深度学习,人工智能可能甚至达到像我们畅想的科幻小说一样效果。我拿走了你的 C-3PO,当然,你有《终结者》就行。