差别隐私,iOS 10 更新升级的保护伞

    在WWDC2016 中公布的即将升级的操作系统中,iOS是更新最多的一个平台。其中包括Quick Type预测能力的加强与Spotlight全局搜索的升级。

差别隐私,iOS 10 更新升级的保护伞

Quick Type(输入预测)是一款前年推出的键盘应用,主要为用户在输入时提供预测性建议,即联想输入。更新后,键盘可以基于Siri,更加智能的为用户提供词语联想,也可以利用键盘做更多的事情,比如发动定位、使用不同国家的语言等。


Spotlight是一个基于系统内所包含信息的快速搜索功能,可以根据搜索关键词搜索到系统内所有的相关信息,包括联系人、信息、邮件、歌曲等。现在的spotlight只能在主屏幕向左滑动时出现,更新后,在锁屏界面与通知栏中也将出现搜索框。

差别隐私,iOS 10 更新升级的保护伞

二者都需要在了解用户习惯的基础上来提供更好的操作体验,且使用的时间越长,显示的结果会更优。加强这些应用,也就意味着需要获取更多的用户数据。苹果一直主张,真正贴近你的技术,也应真正保护你的隐私。在这次WWDC的主旨演讲中可以了解到,iOS10将内置一种创新安全保护功能,差别隐私保护(Differential Privacy)。

在苹果发给媒体的邮件中,关于iOS 10的更新前瞻里这样介绍道,

“从iOS 10开始,苹果将使用差分隐私技术,使系统在不影响个人隐私的前提下,帮助发现大批量用户的使用模式。为了掩盖个人身份,差别隐私会像个人使用模式的小样本中加入数学噪音。随着更多的用户呈现出相同的模式,总体模式就会开始显现,这可以用来增强用户体验。”

差别隐私,iOS 10 更新升级的保护伞

WWDC现场,负责苹果软件工程的高级副总裁Craig Federighi说,

苹果从不收集用户的个人隐私,并且会尽可能的在用户所使用的手机上而不是在服务器上,保护好其个人信息。我们深信,用户在拥有优秀功能的同时,也应该拥有更好的隐私保护。差别隐私保护是统计和数据分析领域中的研究主题,利用哈希、分段抽样和噪声注入等方法,在实现众包学习时也完全保护了用户的个人隐私。苹果在这个技术方面做了很多非常重要的努力,来确保其可以进行大规模的应用。

照苹果的说法,差别隐私是一个统计学的概念,在试图更多分析了解一个群组信息整体趋势的同时,可以尽可能少的了解这个群组中的个体详情。利用差别隐私,苹果可以收集和存储其用户数据,并从中总结出用户们在做什么、喜欢什么、想要什么等,但同时又不会提取到有关该群体中任何可能会侵犯隐私的个人信息。并且在理论上,黑客或者情报机构也不可能提取到这些个体信息。

Federighi在演讲中还提到过一本已经出版的,关于差别隐私的书。这本书的联合作者是宾夕法尼亚大学计算机教授Aaron Roth。苹果在研发出差别隐私技术后就给他进行了展示。Roth说,

一个大数据集里包含有个人信息,你可能会需要一种机器学习算法来从数据库中获取数据化的“总结”,但又想要保护这些数据不被一些外界的攻击者或窥探者所收集。这种保护并不是一种简单的模糊化或者匿名化保护。

2007年,美国一家在线视频网站Netflix,为了优化网站的推荐功能,发布了大量用户的电影点评,其中隐去了用户的名字及与其相关的个人信息。但是黑客很快通过对Netflix数据与IMDB上公众点评数据进行相互对照,找出了两个网站之间相似的点评推荐,从而获得了这个匿名数据库中的用户姓名。

Roth认为,模糊化或匿名画的处理只是可能采取了一些比前人略为聪明的办法来保护你的数据,但随时有可能出现比你更聪明的人,对数据集进行反匿名化。差分隐私保护能够彻底封堵这种回路,因此是不会过时的。

但有一点值得注意,Fedrighi在演讲中把差别隐私称作是一个“研究主题”。约翰霍普金斯大学密码学教授Matthew Green认为,未经严格检验的差别隐私技术,很有可能存在危险。Green还在Twitter上发布了一系列针对苹果差分隐私的质疑。

这的确是个很棒的想法,但我从未真正见过它被应用。它最终会成为数据准确性和隐私之间的折衷。而隐私性的提高必然会伴随着准确性的降低。


大多数人(在面对新技术时)都会从理论走到实践,然后再大范围应用。而在面对差分隐私时,苹果似乎省略了中间步骤。


(差别隐私技术是否真的安全),问题在于(苹果所使用的)数据类型、测量方式和具体用途。

在大数据时代,随着交互式应用的不断发展,如何保护隐私数据和防止敏感信息泄露已渐渐成为科技企业中面临的重大挑战。大数据隐私以及数据挖掘中的隐私问题也成为了信息安全领域目前的一个研究热点,差别隐私保护较传统的隐私保护模型有着许多的优势。但都还处于研究展望中,没有具体的应用实例。

目前也还没有关于苹果差别隐私保护技术更详细的资料,还无法验证这一技术在实际操作中是否像Fedrighi所说的那样神奇。但正如Green教授所说,苹果的差别隐私到底安不安全最终取决于他们打算如何利用这一功能,以及他们对数据处理的技术是否可靠。一旦成功,苹果又将会创造出另一个技术传奇,并在此基础上对所有交互式应用进行一次深度升级。

  
 
  本文作者:张丹

本文转自雷锋网禁止二次转载,原文链接
上一篇:[20180309]不好的数据结构设计.txt


下一篇:报名| 9.29深圳·阿里云人工智能沙龙,AI大咖面对面