来源: 发布时间:2022-4-1 17:37:44
科学家借助AI技术破解蛋白质结构预测难题

   科学家们一直希望通过基因序列简单地预测蛋白质形状——如果能够成功,这将开启一个洞察生命运作机理的新世界。英国DeepMind公司和美国华盛顿大学分别公布了多年工作的成果:先进的建模程序,可以预测蛋白质和一些分子复合物的精确三维原子结构,并将这些结构放入公开的数据库免费供全球科研人员使用。

   据DeepMind公司报告显示,其人工智能程序AlphaFold预测出98.5%的人类蛋白质结构,有助于深入理解一些关键生物学信息,从而更好开展药物研发。相关论文2021年7月15日在线发表于《自然》。

   研究人员提供了第一个可以定期预测蛋白质结构的计算方法,即使在没有类似结构的情况下也能达到原子级精度。研究人员在具有挑战性的第14届蛋白质结构预测关键评估(CASP14)中,验证了这个完全重新设计的基于神经网络的模型——AlphaFold,其在大多数情况下显示出与实验相竞争的准确性,并大大超过了其他方法。最新版本的AlphaFold的基础是一种新的机器学习方法,通过利用多序列排列的方式,将有关蛋白质结构的物理和生物知识纳入深度学习算法的设计中。

   美国华盛顿大学创建的高精确的蛋白质结构预测程序名叫RoseTTAFold,基于深度学习,它不仅能预测蛋白质的结构,还能预测蛋白质之间的结合形式。仅需10分钟,RoseTTAFold就能用一台游戏电脑准确计算出蛋白质结构。相关论文2021年7月15日刊登于《科学》。

   RoseTTAFold是一个“三轨”神经网络,这意味着它同时考虑一维蛋白质中的氨基酸序列、二维蛋白质的氨基酸如何相互作用以及蛋白质可能的三维结构。在这种架构中,一维、二维和三维信息来回流动,从而使神经网络能够共同推理出蛋白质的化学部分与其折叠结构之间的关系。

   该团队已经使用RoseTTAFold计算了数百种新的蛋白质结构,其中包括许多来自人类基因组的知之甚少的蛋白质。研究人员还生成了与人类健康直接相关的蛋白质结构,包括与非正常脂质代谢、炎症障碍和癌细胞生长相关的蛋白质结构。这些成果都表明,RoseTTAFold可以仅用从前所需时间的很小一部分,构建出复杂生物组件的模型。■

 

 

《科学新闻》 (科学新闻2022年2月刊 封面)
发E-mail给:      
| 打印 | 评论 |