美国能源部橡树岭国家实验室(下称ORNL)利用美国功能最强大的超级计算机,开发出一种人工智能系统,一天之内就能生成神经网络,而且比任何人类都做得更好。
即使是最聪明的数据科学家也需要好几个月才能开发出深度学习软件。即使是Google的AutoML,也需要数周的时间才能设计出一个优秀的图像识别系统。
利用超算,AI能在一天之内生成神经网络
橡树岭国家实验室(ORNL)的超级计算机Titan,拥有超过18,000个GPU。
ORNL研究小组的算法叫做MENNDL,即深度学习的多节点进化神经网络。这个算法并不是用来创建那种收集可爱猫咪照片的AI系统。相反,MENNDL是测试和训练数以千计的潜在神经网络的工具,以处理特殊的科学问题。
ORNL的博士后研究员Steven Young指出,这就需要采取与Google和Facebook的 AI平台不同的方法。
他解释说:“我们发现那些(神经网络)通常不是许多问题的最优网络,因为我们的数据虽然可以被认为是图像,却其实是不同的。 这些图像和问题,与物体检测有很大不同。”
论文摘要
该研究团队发表了一篇名为Optimizing deep learning hyper-parameters through an evolutionary algorithm的论文。以下是论文摘要:
由于深度学习具有相对自动特征生成和高精度分类能力,近来在成像和语音应用中取得了许多成功。虽然这些模型通过数据驱动的方法学习参数,但通过超参数选择的模型选择(作为架构构造)仍然是单调乏味且高度直觉驱动的任务。为了解决这个问题,我们提出了多节点深度学习的进化神经网络(MENNDL),作为一种通过遗传算法进行超参数优化来实现计算集群网络选择自动化的方法。
论文地址:https://www.ornl.gov/content/optimizing-deep-learning-hyper-parameters-through-evolutionary-algorithm
应用案例
MENNDL曾应用在费米国家加速器实验室的粒子物理实验中。费米实验室的研究人员对中微子和高能亚原子粒子很感兴趣,这些粒子很少与正常物质相互作用,但可能是理解宇宙形成早期的关键。费米实验室的一个实验涉及到一种中微子相互作用的“快照”。
该团队想用AI系统对费米实验室的探测器数据进行分析和分类。 MENNDL在24小时内评估了500,000个神经网络。其最终解决方案优于人类科学家开发的定制模型。
在另一个涉及与孟菲斯圣裘德儿童研究医院合作的案例中,MENNDL把人类设计算法在脑组织三维电子显微镜图像内线粒体识别错误率减少了30%。
Young表示:“我们的AI能够在很短的时间内为特定的数据集设计网络,而且比人类做得更好。”
MENNDL能够定义最优超参数来处理特定的数据集,这使它脱颖而出。
“你并不总是需要一个庞大的网络。有时你只需要一个具有正确超参数的小型网络,”Young说。
项目展示
研究项目展示地址:http://ornlcda.github.io/MLHPC2015/presentations/4-Steven.pdf
下个超算将更强大
ORNL的团队预计,实验室的下一个超级计算机Summit明年上线时,可能会产生更大的影响。虽然Summit只拥有4600个节点,但它将采用Nvidia最新最强的GPU和IBM的CPU。这意味着Summit将提供超过世界第五超算Titan的五倍以上的计算性能。
Young说:“Summit将以更快的速度解决更复杂的问题。”
原文发布时间为:2018-01-04
本文作者:Cecilia
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号