像人类一样,机器也能识别模糊的面部图像——而且更快
得克萨斯大学和康奈尔科技学院的研究人员称,打码(像素化图像)是模糊身份的狡猾方式,但计算机可被训练得能识别出这些“被保护”的人。
如果攻击者有一套清晰的照片可供练习,被像素化模糊的部分便昭然若揭。只要人工智能(AI)也能有相应的清晰照片集用以训练,面部马赛克作为匿名机制这种事还是让它飘散在风中吧。
听起来似乎没什么大用——人类也能做到同样的事情,但由于计算机化了,便可以自动执行,也就是说可以日夜不停,快速进行。
arXiv科学论文电子预印本库中的一篇论文( http://arxiv.org/pdf/1609.00408v1.pdf )称,像素化(拼接)、模糊(如YouTube上用的一样),甚至加密JPEG系数(被称为P3的机制:“隐私保护照片共享”),也挡不住恢复被保护的图像。
他们认为,人工神经网络可被训练来成功识别人脸、物体和手写签名,即使这些图像用上述模糊技术处理过。基于不同数据集合不同模糊类型,成功率在50%到95%之间。
他们的AI不需要人类来指出重要特征。不仅不需要预先指定相关特性,也不用知道部分加密或模糊化的图像泄露出来的究竟是什么。神经网络会自动发现相关特性,并学会利用隐藏和可见部分之间的联系。
处理照片中唯一的难点,在于攻击者需要巡游社交媒体,搜罗可能出现在给定照片中的可能人脸集合。但对于明星或公众人物来说,这都不是事。
同样的方法,适用于恢复被模糊化了的文本或手写文字,只要攻击者能找到训练数据集(就像图像识别模型的基准一样存在于网上)。该论文还描述了用于训练此模型的神经网络架构,可供意图更好地保护图像隐私的开发者当做参考基准。
本文转自d1net(转载)