一周AI最火论文 | 世界就是你的绿屏 ,任何背景一键抠像!

本周关键词:对象检测Deepfake

本周最火学术研究

机器人真的可以学会像动物一样移动吗?

众所周知,动物非常敏捷。机器人可以达到它的水平们吗?开发具有复制这种敏捷度的机器人,有利于创造在现实世界中能处理各种复杂任务的机器人。

最新研究:Google AI研究人员讨论了两个最新项目,旨在应对当前机器人敏捷性方面的挑战。首先,研究人员描述了机器人如何通过模仿真实动物的动作来学习敏捷行为,从而产生快速流畅的动作,例如小跑和跳跃。然后,他们讨论了一种用于在现实世界中,自动进行运动技能训练的系统。这个系统可使机器人在最少的人工帮助下,学习自我行走。

研究结果:使用上述提出的方法,机器人学习并模仿了狗的各种运动技巧,包括不同的步行步态(例如踱步和小跑)以及敏捷的旋转动作。

扩展阅读:

https://ai.googleblog.com/2020/04/exploring-nature-inspired-robot-agility.html

世界即是你的绿屏 – 一项背景遮罩生成(抠像)技术

你能想象,仅仅通过使用智能手机在日常环境中拍摄照片或视频,就能轻松地为每个人的每个像素的颜色和不透明度创建遮罩吗?

这篇论文提出了一种背景遮罩生成方法,该方法可以在自然环境中随意获得高质量的前景+ alpha遮罩。这种方法避免了使用绿屏,也避免了为获得高遮罩质量通常需要精心构造的详细的trimap 图。由于一个关键的难点是,缺少背景遮罩生成问题的真实数据,因此研究人员开发了一种在合成复合数据上训练的深度学习框架,然后使用对抗网络将其应用于真实数据。

研究结果:在多种照片和视频上比现有技术有了显著改善。

扩展阅读:

https://arxiv.org/abs/2004.00626v1

基于EfficientDet进行可扩展的高效对象检测

近年来,各国研究员们在更精确的物体检测方面取得了巨大的进步。同时,最新的物体检测器,却也变得越来越昂贵。

在本文中,Google Research Brain 组的研究人员,系统地研究了用于有效对象检测的网络体系结构设计选择,并提出了加权双向特征网络和定制的复合缩放方法,从而提高了准确性和效率。

基于这些优化,他们开发了一个名为EfficientDet的新检测器系列,在各种资源限制条件下,该检测器比现有技术具有更高的准确性和效率

研究结果:EfficientDet在COCO测试设备上以52M参数和325B FLOP,实现了最新的52.2 AP。这比现有检测器小4到9倍,使用的FLOP减少了13到42倍。


源代码已在Github开源:https://github.com/google/automl/tree/master/efficientdet

扩展阅读:

https://arxiv.org/abs/1911.09070v3

改进科学出版物的建议

如“决策树森林”中的一个决策树对它作出的判断进行了一些细微的修改,但没人在科学界发布它,那这真的是“最新技术”吗?—乔治·伯克利

近日,一项研究表明,您可能不再需要遵循传统的同行评议形式进行科学手稿评估。这群研究人员提出了一种高度可扩展、全自动的方法对论文进行审查,并从主要的计算机视觉和机器学习会议的最佳实践中汲取了灵感。

这些研究人员希望通过清晰易懂的审阅指标,来推动科学研究进入又一个黄金时代,因为科学家们都希望自己能够做出既新颖又十分先进的研究成果。

扩展阅读:

https://arxiv.org/abs/2003.14415v1

如何用“白盒”和“黑盒攻击”来回避Deepfake图像检测器

合成高度逼真的“假人”图像如今已经越来越容易,并且被很多人用于创建虚假的社交媒体信息来进行欺诈。

研究人员正在努力开发和部署检测这一类合成内容的算法。

虽然最流行的取证方法之一是训练神经网络以区分真实内容与合成内容,但Google Brain和加州大学伯克利分校的研究人员现在表明,取证分类器易受一系列攻击的攻击,这些攻击将分类器的准确性降低至接近0%。

攻击者们开发出一种黑盒攻击,不用接触目标分类器,就能将ROC曲线(AUC)下的面积从0.95降低到0.22。



上一篇:医生开错药?AI来提醒!谷歌和UCSF合作开发机器学习模型,高性能预警潜在危险


下一篇:红遍AI圈的fast.ai课程上新啦!亲自跟着Jeremy一起上课是种什么体验?