Facebook是一个非常成功的社交网络公司,而它在人工智能领域的成就同样不能小看。
最近,中美互联网论坛在西雅图召开,对于Facebook是否能入华再次成为焦点。如今的Facebook已经不仅仅是一个成功的社交网络公司,近年来,它用无人机提供互联网服务、收购Oculus发展虚拟现实、不断探索人工智能,可以说Facebook已经成为了世界上最先进的科技研究中心之一。
当然现在包括谷歌、IBM等公司都对人工智能有强烈的兴趣,而Facebook也加大了对这个领域的投入,希望解决模拟一般智力的问题——即让计算机日渐脱离线性逻辑的机器的思考方式,而像我们*形态的人类以多管齐下的方式来思考。下面我们就来深度解析下关于Facebook人工智能的那些事。
Facebook人工智能研究室
一切始于2013年,Facebook的巨大成功并没有阻止创始人兼CEO Mark Zuckerberg对未来十年、二十年发展的探索。当然,Facebook其实也已经将机器学习运用到其流行的社交网络中,比如说决定用户会在News Feeds中看到什么内容。不过相比起当时前沿的神经网络成果,这不过是小儿科。一些Facebook工程师也一直在尝试卷积神经网络(CNNs),这是一种非常强大的机器学习,现在普遍被用于图像识别。 即便人工智能还处于发展初期,Zuckerberg对它的潜力依然非常看好,因此组建一支最好的人工智能研究实验室的想法就出现了。
他从谷歌大脑(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程师。然后追本溯源找到了卷积神经网络的发明者——Yann LeCun作为人工智能实验室的负责人。Yann LeCun是人工智能界的一个传奇,卷积神经网络是他职业生涯的巅峰之作。你是否曾经好奇过ATM怎么能识别你的支票?这就得益于 LeCun负责的「SN」的神经网路模拟器的早期研究,于1996年被采用。
作为人工智能实验室负责人Yann LeCun被Zuckerberg授予了完全的信任,而他对研究室也有自己的看法,如果你想要吸引顶尖人才,你得有一个雄心勃勃的研究室,和一个雄心勃勃的长期目标。然后你还得给他们工作上的*权,同时对你的研究你必须持有非常开放的态度。这和Facebook一贯开放到理念也是不谋而合的。
这个肩负着Facebook的未来的团队规模很小,由大约 30个研究科学家和15名工程师组成。团队有三个分支:由LeCun管理着一个由20名工程师和研究人员组成的团队。Menlo Park的是一个同等规模的分支。六月,FAIR又在巴黎设立了一个更小的5人组,还有很多在Facebook其他部门一起合作致力于人工智能发展的团队。
这些研究人员和工程师来自科技领域的各个层面,同时当中很多人都曾与Lecun合作过。比如负责领导语言研究子群的Leon Bottou,是LeCun的一个老同事,他们曾一同研发了神经网络模拟器;他们的团队顾问 Vladimir Vapnik,曾和Lecun一起在贝尔实验室工作,发表了关于机器学习的形成性研究,其中包括一项测量机器学习能力的技术,他也是统计学习理论之父。
Facebook对人工智能的探索
迄今,最好的人工智能系统也是愚钝的,因为它们没有常识。现在对于机器如何学习简单的推理能力,人工智能领域的专家知道得并不多。而Facebook也正致力于制造能足够好地学习已知世界的机器。
「记忆网络」
LeCun将记忆网络的工作整合进卷积神经网络,并使它们获得记忆保持的能力。LeCun把这个新的记忆模型比作大脑中的分别由海马体和大脑皮层控制的短期记忆和长期记忆。而记忆单元允许研究者向该「记忆网络」讲说一个故事,随后使该网络回答关于这个故事的问题。
比如我们把《指环王》一书的主要情节简短概述给「记忆网络」,当被问及在书中某一具体情节中魔戒在哪里,这个「记忆网络」能做出简短正确的回答。这意味着它理解书中事物与时间的关系,而不是从全书中做简单的搜索。
「嵌入世界」
为了能搭建出一个系统,确保让所有人可以把时间花在他们真正关心的事情上,FAIR团队开发了一个被称为「嵌入世界」的项目。
在嵌入世界项目中开发的人工神经网络能够根据视觉相似性将在同一地点拍摄的两张不同照片连接起来,并能指出文字描述是否符合场景。它重建了现实的一种虚拟记忆,并将之在其他地方和事件的背景下进行聚类。它甚至能根据一个人之前的喜好,兴趣以及数字经历「虚拟地表示这个人」。虽然这还只是带有实验性质的,但是对Facebook的新闻流呈现具有很大的影响,在跟踪标签上也进行了一定的使用。
另外,Facebook的人脸识别技术已达到世界第一,通过DeepFace这项技术,Facebook的人脸识别已达到97%的准确率。
「计算机视觉」
Rob Fergus领导着有关计算机视觉的AI团队,他们已经在自动标记相片上得到使用,接下来将被用于标记视频。大量视频因为缺乏元数据,或者没有任何描述性文本,而被淹没于噪声中。AI将会能够观看视频,并将它们大致分类。
这对Facebook阻止那些不想被上传到他们服务器上的内容具有巨大的意义—例如色情照片,版权问题或者其他违反他们使用条款的任何内容。它也能鉴别新闻事件,对不同类型的视频进行管理。Facebook此前一直将这些任务划分给外包公司,当这项技术稳定后,Facebook就能降低这部分的人工成本。
在目前的测试中,人工智能表现得很有希望。给它播放一段正在进行的体育视频,比如冰球、篮球或乒乓球,人工智能能够准确地识别出这个体育项目。并且还可以区分垒球和棒球,漂流和皮划艇,以及篮球和街球这些类似的运动。
「语言科技」
Facebook本着让世界更开放更连通的宗旨,因此语言服务是它的重点,因为超过一半以上的Facebook用户不说英语,然而Facebook上大部分的内容都是通过英语呈现的,因此如何能智能的翻译也就是语言科技小组成立的原因。
我们知道过去Google翻译那种直接逐词翻译有很大的缺陷,因为一些语法、俚语的原因导致翻译的不准确,而Facebook在翻译里面加入了人工智能的元素,让翻译更精确。比如:约有三亿三千万用户经常点击「见翻译」按钮使用这些翻译服务。如下图所示:
如果你是第一个点击翻译按钮的人,恭喜,你已经开始操作人工智能了。人工智能本身具有适应性,经过训练后便可以很快掌握俚语。语言科技小组最近发现法国球迷在用一个新俚语表达「wow」,人工智能在接受那部分公用数据的神经网络训练以后,现在能够可靠地将文本翻译出来。他们通过每天对人工智能进行新数据的训练扩展Facebook的词库,不过所有语言的词库正在按月更新。
「Facebook M」
我们已经习惯于个人数字助理,比如Siri、Cortana,以及Google Now。但Facebook选择了一条不同的道路,其名为「M」的新型个人AI助理拥有超越手机界限处理复杂事物的能力。比如Siri可以发短信,而M可以预定航班或制定旅行计划。
Facebook M的主干来自于今年早些时候收购的一家创业公司:Wit.ia。人工智能不仅帮助M更好地完成一般的任务,也能完成有一些特殊情况的任务。并且Facebook设立了「AI训练者」,主要可以让M从人类训练者身上学到应该怎么做,并应用到之后的任务中,这其实更像是人类学习的过程。
Facebook在人工智能团体中的角色
“我们的研究项目都是完全公开的。几乎我们做的每件事都会发布,大部分的代码也都是开源的。” LeCun 说道。“你可以在 Facebook 的研究网站上和 ArXiv——一个收纳电脑科学、数学及物理研究的图书馆,找到这些出版物。”这其实就能看出Facebook整个团队的态度,研究固然对他们的用户很重要,但它的核心价值更佳体现在让人类对如何更好地用机器来模仿智能的知识。
也是人工智能的研究本来就是最复杂的科学挑战之一,不可能凭借某个人或者某个公司自己解决,它需要集体的力量,我们也希望Facebook的人工智能会带给我们更多的惊喜。