谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

 DeepMind表示,AlphaFold 2可以对蛋白质的基本物理结构进行十分准确的预测,并能够在几天内生成高精度的结构。 此外,模型还能利用内部的内部置信度来预测每个预测的蛋白质结构中哪些部分是可靠的。 训练数据来自大约17万个蛋白质结构,以及包含未知结构的蛋白质序列的大型数据库。 期间DeepMind使用了16个TPU进行训练(即128个TPUv3核心或大致相当于约100-200个GPU)。 

谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

神经网络模型结构 其中,模型对蛋白质序列以及氨基酸残基对进行操作,在两种表征之间迭代传递信息以生成结构。 

谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

AlphaFold生成的蛋白质高精度结构 

谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)


架构细节


RoseTTAFold:媲美AlphaFold 2的预测工具


无独有偶,隔壁Science杂志也刊登了另一个蛋白质结构预测的工具,名叫「RoseTTAFold」,特点是「快、准、狠」。 2020年,DeepMind在CASP 14大会上介绍了它在该蛋白质结构预测上的显著进展。 华盛顿大学医学院蛋白质设计研究所的研究人员看在眼里,受其启发,与哈佛、剑桥、德克萨斯大学西南医学中心、劳伦斯伯克利国家实验室联手,共同研发了一款基于深度学习的蛋白质结构预测工RoseTTAFold。 这款工具利用深度学习,仅凭有限的信息,就能在普通游戏本上快速而准确地预测蛋白质结构,在短时间就能构建出复杂的生物组建模型。 目前,该研究团队已经用RoseTTAFold计算出了数百种新的蛋白质结构,其中就包括了许多鲜为人知的人类基因组蛋白。 RoseTTAFold预测出了与脂质代谢问题、炎症紊乱和癌细胞生长相关的蛋白质结构。 RoseTTAFold是一个「三轨」神经网络("three-track" neural network),它能够兼顾蛋白质序列模式、氨基酸如何相互作用以及蛋白质三维结构的可能性。 在这个架构中,信息在一维(氨基酸序列)、二维(距离)和三维(坐标)之间来回流动,从而能够集中推理出蛋白质化学部分与折叠结构之间的关系。 


谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)RoseTTAFold 架构包含一、二、三维注意力轨道,轨道之间信息能够来回流动谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)  在CASP14目标取得的平均TM-score谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

在CAMEO实验中取得的盲基准结果 蛋白质结构预测不断取得新进展,最关键的问题莫过于:能够使用什么准确的蛋白质结构模型? 团队研究了RoseTTAFold通过X射线晶体学和低温电子显微镜,研究了促进实验结构测定实用性,为目前为之结构的关键蛋白质提供模型。 RoseTTAFold方法的准确性远高于现有方法,因此,研究人员希望能够测试出这款工具是否能够解决分子置换(MR)这一从未解决的问题。 在蛋白质数据库(PDB)中,有四种蛋白无法用MR解决:牛属甘氨酸N-酰基转移酶(GLYAT)、细菌氧化还原酶、细菌表面层蛋白(SLP)和来自真菌平革菌属金孢子菌属的分泌蛋白,因此研究人员使用RoseTTAFold重新分析蛋白质结构。 



谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

由于蛋白质结构的测定能够为生物功能和机制提供大量见解,团队也研究了RoseTTAFold是否也能有这样的功能。 研究人员主要针对两组蛋白:目前未知结构的G蛋白偶联受体;与疾病相关的人类蛋白质。 研究结果发现,即使没有已知结构的密切同源物,RoseTTAFold模型在活性和非活性状态下也能做到准确预测构型。



谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)


研究人员使用RoseTTAFold工具,从序列信息中预测了大肠杆菌蛋白复合物的结构。图A中,灰色表示第一条亚基,彩色表示第二条亚基。图C是RoseTTAFold生成的IL-12R/IL-12复合结构。 论文一作Minkyung Baek希望RoseTTAFold这个新工具未来能够造福整个研究领域。



上一篇:请问如何在出错后能恢复到改变设置前的状态?


下一篇:Mongo:update更新多条数据