本周关键词:AutoML、强化学习、VR
本周最佳学术研究
用AutoML-Zero从零开始发展的机器学习算法
在最近的一篇论文中,为了鼓励更多AutoML的研究,Google AI展示了从头成功开发ML算法的可能性。
以前,AutoML的作用是,通过神经体系结构搜索(NAS)技术,对不同需求自动生成并设计出相应的机器学习算法。
想使用NAS,需要专家来构建复杂的设计层来帮助构建神经网络。但是,在研究员称为AutoML-Zero的这种新方法中,Google AI展示了一种替代方法,可以自动发现以基本数学运算为基础的完整ML算法。
在小图像的分类问题上,该新方法重新发现了基本的机器学习技术,例如带有反向传播的2层神经网络,线性回归等。所获得的结果证明了,使用算法自动发现机器学习算法是可行的,这对解决未来的难题可能很有借鉴意义。
原文:
https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html
深层次变分自编码器
在本文中,NVIDIA研究人员提出了一种称为Nouveau VAE的深度变分自动编码器(VAE),该编码器使用深度方向可分离的卷积以及批归一化,来生成大型高质量图像。
NVAE的设计着眼于解决两个主要挑战,首先是设计针对VAE的具有强表现力的神经网络,第二则是在保持训练稳定性的同时,扩展训练到更多层,让它适合更多不同的图像尺寸。
这项工作表明,NVAE在MNIST,CIFAR-10和CelebA HQ数据集中基于非自回归似然性的模型中,得到了最优的结果。NVAE也为FFHQ提供了强有力的基准线。例如,在CIFAR-10上,NVAE将最新技术从每维2.98位提高到了2.91位,并在CelebA HQ上生成了高质量图像。据研究人员称,NVAE是第一个成功应用于大尺寸256×256像素自然图像的VAE。
原文:
https://arxiv.org/abs/2007.03898
有限资源深度学习的中高效的数据和计算设计
深度学习最近已越来越靠近边缘设备,这为创造需要实时分析数据的新应用程序,提供了可能。但是,深度神经网络的计算量很大,需要大量的数据进行训练以及复杂的体系结构,才能实现最新的性能。
本文中,为了实现更好的泛化和更高效的推理,研究人员试图通过结合量化和等方差的方式来解决此问题。他们设计并测试了MobileNetV2的等变版本,并通过模型量化对其进行了进一步优化,实现了更高效的推理。结果显示,这个设计对Patch Camelyon(PCam)医疗数据集具有最先进的性能,同时计算效率更高。
原文:
https://arxiv.org/abs/2004.09691v2
Duality — 强化学习新方法
谷歌AI研究人员开发了一种用于强化学习(RL)的新方法,可以实现既实用又符合数学原理的算法。这意味着所得到的算法可避免使用非常粗略的近似来实现其数学基础原理。
基于凸对偶性所得到的方法是一种经过充分研究的数学工具,用于将以一种形式表示的问题转换为其他形式的等效问题,从而可能更利于计算。谷歌AI研究人员所开发的在强化学习(RL)中应用对偶性的特定方法,将传统的约束满足式数学问题转换为无约束且更实际的数学问题。
他们希望强化学习和(凸)优化之间的联系可以促进这两个领域研究人员之间的进一步合作。
原文:
https://ai.googleblog.com/2020/07/duality-new-approach-to-reinforcement.html
利用真人互动改进虚拟辅助机器人
在这个项目中,研究人员提出了辅助虚拟现实健身房(AVR Gym),这是一个开源框架,用于真人与虚拟辅助机器人的交互。
研究人员认为,多功能的机器人护工可以使全球数百万人(包括老年人和残疾人)受益。
由于对如何使机器人护工通过物理模拟学习与人互动的研究仍然是一个巨大的挑战,因此他们提出的方法可能还需要很长时间才能实现。
研究人员提供的证据表明,AVR Gym可以帮助他们提高受过模拟训练的辅助机器人的性能。其成果显示,VR可以通过让真人与虚拟机器人进行交互,帮助缩小物理模拟与现实之间的差距,从而为实现真正的机器人辅助铺平道路。
原文:
https://arxiv.org/abs/2007.04959v1
其他爆款论文
人脸3D重建新方法 - 用单色图像即可生成高质量的重建图像,且可以适应自遮挡和大范围姿势变形:
https://arxiv.org/abs/2007.03979v1
基于神经架构搜索的新型目标检测架构:
https://ai.googleblog.com/2020/06/spinenet-novel-architecture-for-object.html
利用图卷积神经网络优势,打造一种有效的基于图表的视触觉融合式3D重建方法:
https://arxiv.org/abs/2007.03778v1
Pix2Vox++:一种在准确性和效率上均优于传统方法的新型3D对象重建方法:
https://arxiv.org/abs/2006.12250v2
改进GAN实现语音增强:
https://arxiv.org/abs/2001.05532v2
资源
一个涵盖机器学习论文及代码实现的免费分享社区:
https://paperswithcode.com/methods
Pytorch官方教程免费书籍下载:
https://pytorch.org/deep-learning-with-pytorch
Gradio:仅需几行代码,即可为机器学习模型甚至Python函数生成易用的web界面:
https://gradio.app/
AI大事件
福布斯AI 50排行榜多家公司创始人预测后新冠疫情时代的AI发展空间:
https://www.forbes.com/sites/kenrickcai/2020/07/10/ai-50-founders-post-coronavirus-predictions/#17c8ce6d2ccc
亚马逊官宣将在未来几个月内开始使用无人机运送包裹:
https://www.zdnet.com/article/amazon-unveils-drone-that-will-be-delivering-packages-in-months/
大众创新为AI肺癌筛查提速:
https://www.zdnet.com/article/researchers-find-crowdsourcing-ai-go-together-in-battle-vs-lung-cancer/