透过Facebook Moments应用，LeCun带我们瞻望计算机移情能力

2022-03-08 00:28:42

编者按：一年前，Facebook发布了照片分享应用Moments，于前不久关闭了iOS版Facebook照片同步功能，力推Moments应用，该应用运用了人脸识别技术。不过，Facebook人工智能实验室负责人Yann Lecun在为我们通俗易懂地介绍Moments的应用原理时表示，除了简单的人脸识别技术，Facebook将利用更卓越的计算机视觉技术和AI技术为用户提供更多便利，如尝试开发计算机的移情能力，当然，这些便利的应用背后需要强大的算法和繁琐的训练过程做支撑。让我们一起期待未来计算机能够更好地理解人类，使我们的工作、生活更为便捷。

Facebook强力推行的照片分享应用Moments通过运用图像识别技术，使用户可以扫描朋友的照片创建私人群体相册。当有六个人在活动现场同时拍照时，Moments使所有参与者相互之间能够更为便捷地分享照片，省去了把快照通过邮件发送给每一个人，然后再创建相册的繁琐过程。当然，这种应用并不像发现治疗癌症的方法一样，称得上是“壮举”，但是，在这种便捷照片分享应用背后有着令人印象深刻的技术，Facebook花了几年的时间才开发出这种技术。

Moments应用的关键点在于有Facebook的算法作为支撑，使得这种应用能够在不同的照片中识别出同一个人的面容，如此一来，Moments能够知道有哪些人在活动现场。这就要求具备计算机视觉专门知识，Google, Microsoft，Baidu及其他公司一直以来都致力于计算机视觉领域的研究，其应用从自动驾驶车辆到傻瓜式网络产品，如微软的“我看起来多大年纪”应用，变化不等。

Moments的发布代表着Facebook正在与全世界分享其在计算机视觉领域研究所取得的成功。Facebook人脸识别精度能够达到98%，识别速度也是非比寻常，能够在不到5秒的时间内，从8亿张照片中识别出你的照片。最后，即使不能获得你的正面镜头（或者你的脸根本没有出现在照片中），Momemts都能够轻松识别出你的照片，这一切都要归功于一种机器学习算法，该算法能够兼顾图片中与照片数据有关的其他元素内容。

Moments的发展源头

Fortune曾经采访过Facebook人工智能实验室负责人Yann LeCun，采访过程中了解到他的团队是如何帮助一台计算机理解“你是谁”，及下一步Facebook在AI研究领域将有何新进展。在LeCun谈论计算机视觉时，也许我们首先要理解：尽管教会软件识别对象的过程与人看外界事物具有相似之处，我们依然不能将计算机视觉简单地等同于人看外界事物。

例如，Facebook的人脸识别技术不能识别出你。只有当两张照片中的人是同一个人时，这种技术才能够识别出被识别对象。人脸识别技术实际上是一个完全分离的步骤。

由于Facebook主要是为了建立人与人之间的密切联系，其计算机视觉技术以识别人脸为侧重点，不用于识别猫，车辆或其他物理实物。为了实现这一目的，Facebook采用一个被称为“Labeled Faces in the Wild”的数据库，该数据库由名人和政客的照片组成。数据库中含有13000张照片，照片中人们以不同的发型，不同的服装，有时戴眼镜或其他的装饰物出现。Facebook使用该图像集训练其机器学习算法。其他公司也曾使用该数据集，一些大学运用该图像集训练系统，识别精度达到98%。

因此，Facebook究竟是如何通过给一台机器一张Angelina Jolie的照片，然后，在这张照片的帮助下，使这台机器从不同的相册中识别出你姐姐的呢？LeCun可以为我们解答这一难题。大约20年前，当LeCun在贝尔实验室工作时，他偶然想到应该如何教会计算机“看”世界，这种想法直到4年前才在学术界之外得到推广应用。

如何教计算机“看”世界

计算机视觉所用到的技术被称为卷积神经网络，该命名来源于被称为“回旋”的数学操作，并从人类大脑的学习原理获得灵感。人类大脑是通过在神经元之间建立联系实现学习的，一个信号被传送给神经元的频率越高，神经元之间的联系越紧密。同理，当计算机为两张图像建立相似度联系时，它将为这些相似度分配权值。在卷积神经网络中，所设定的目标是训练机器，使之能够识别所建立联系之间权重的变化，以便于计算机能够越来越精确地判断图像与图像之间是否匹配。

这种训练识别过程是相当复杂的，涉及到不同的计算方法，运用这些计算方法能够判断一幅图像中哪些特征对于识别图像信息是重要的。例如，如果你想要训练一台计算机来识别人脸，图像背景的像素就显得并不太重要。令人感到不可思议的是，机器能够自行学习，识别出图像种哪些特征是最相关的，然后对这些重要特征进行归纳总结。不过，还是需要人为地推动计算机识别出合理的方式为相似度赋权值，一旦建模成功，计算机将具备归纳总结重要特征的能力。

将会花费几天的时间在一台配置很好的计算机上完成这一训练过程。

当多伦多大学Geoffery Hinton教授带领其研究团队使用卷积神经网络在图像识别算法竞赛中获胜之后，卷积神经网络几乎成为所有计算机视觉研究的基石。之后，Hinton的研究团队和其建立的新公司被Google收购，Hinton以测试误差为15.3%在比赛中获胜，第二名优胜者的成绩为26.2%。

瞻望计算机移情能力

Facebook的自动人脸识别技术有助于用户保护自己的隐私不受侵犯。例如，当自动人脸识别技术得到广泛应用时，你每上传到Facebook一张照片都会及时获得通知。例如，假如你不经意间出现在一个游客在时代广场拍的照片背景中，你能够及时获得通知，有权选择将照片中自己的脸变得模糊，无法识别。对于小孩子，如果出现这种情况，Facebook将自动开启模糊或删除功能。Lecun表示，Facebook对这类应用工具很感兴趣，但是，他同时也强调，Facebook的对机器学习领域的兴趣远远超过图像识别技术。

Facebook的目标是使计算机具备移情能力。很明显，计算机不能感知到人们的行为，不过，能够训练计算机使其具备识别人的情感及人的反应的能力。当计算机的理解能力能够达到这种水平式时，当你将要上传自己喝得醉醺醺的照片时，Facebook将会发出提示，确认你是否真的想要这样做。

“计算机的移情能力远远超过人脸识别技术”，LeCun表示。“我们不关注谁在照片中，我们将运用其他类型的图像识别技术，通过不同手段训练这些技术，使计算机能够识别出——这张照片看起来令人尴尬，提示你是否真的要将照片公之于众。”

当然，Facebook现阶段还不具备开发出这种图像识别技术的能力，但是LeCun提出这些概念作为实验构想，指明了Facebook人工智能研究未来的发展方向。当然，这种仅用一种算法便可以达到的图像识别技术着实会给人们带来深深的不安。现在，由于人们对于个人隐私的关注，Facebook尚未在加拿大及欧盟等国家推广这种自动标记应用。要使得一台计算机能够在几秒内猜测出你分享照片的意图，或者使软件尝试着分析你的笑话，并理解你所讲笑话中的笑点，还要考虑一种潜在变化的影响因素。

“我们的目标是使机器变得更加智能化，能够理解文本，图像，视频及邮件，在数字化的世界里，我们想要机器理解事物发生的场景”，LeCun表示。由于每天都能够接收到如此多的数据内容，人们不免感到不知所措。LeCun的研究团队所做出的努力将帮助人们获取与其兴趣密切相关的内容。要实现这一简单目标可能牵涉到复杂的解决方法：保证你在Facebook上看到自己需要的信息。

“使机器理解人类，这是Facebook一直尝试完成的一项重大任务”，LeCun表示。

本文由雷锋网(公众号：雷锋网)独家编译，未经允许拒绝转载！·

本文作者：高婓

本文转自雷锋网禁止二次转载，原文链接

码农公寓

Moments的发展源头

如何教计算机“看”世界

瞻望计算机移情能力

相关文章