Science|新人工智能软件可以在10分钟内计算出蛋白质结构
自从 DeepMind 在2020年结构预测的关键评估会议(CASP14)上介绍了这一领域的显著进展之后,科学家们已经等待了数月,以获得高度精确的蛋白质结构预测。等待现在已经结束。
西雅图华盛顿大学医学院蛋白质设计研究所的研究人员已经在很大程度上重现了 DeepMind 在这项重要任务上所取得的成绩。这些研究结果将于7月15日星期四发表在《科学》杂志的网站上。
与 DeepMind 不同的是,华盛顿大学医学团队的方法,他们称之为 RoseTTAFold,是免费提供的。来自世界各地的科学家们正在利用它来建立蛋白质模型,以加速他们自己的研究。自7月以来,已经有超过140个独立的研究团队从 GitHub 下载了这个程序。
蛋白质由一串串氨基酸组成,这些氨基酸可以折叠成复杂的显微结构。这些独特的形状反过来引起了生物体内部几乎所有的化学过程。通过更好地了解蛋白质的形状,科学家们可以加快癌症、2019冠状病毒疾病和其他数以千计的健康疾病的新疗法的发展。
“今年是蛋白质设计研究所忙碌的一年,他们设计了2019冠状病毒疾病治疗法和疫苗,并将其投入临床试验,同时开发了用于高精确度蛋白质结构预测的玫瑰花环/折叠。我很高兴科学界已经在使用 RoseTTAFold 服务器来解决突出的生物学问题,资深作者 David Baker 说,他是华盛顿大学医学院的生物化学教授,霍华德·休斯医学研究所的研究员,同时也是蛋白质设计研究所的主任。
在这项新研究中,由贝克领导的计算生物学家团队开发了 RoseTTAFold 软件工具。它利用深度学习技术,在有限的信息基础上快速准确地预测蛋白质结构。没有这种软件的帮助,仅仅确定一种蛋白质的结构就需要数年的实验室工作。
另一方面,在一台游戏计算机上,十分钟就可以可靠地计算出一个蛋白质结构。
研究小组使用玫瑰花环/折叠计算了数百种新的蛋白质结构,其中包括许多对人类基因组了解甚少的蛋白质。他们还生成了与人类健康直接相关的结构,包括那些与有问题的脂质代谢、炎症紊乱和癌细胞生长相关的蛋白质。他们还表明,RoseTTAFold 可以用于建立复杂生物组装的模型,所需时间只是以前所需时间的一小部分。
RoseTTAFold 是一个“三轨道”神经网络,这意味着它同时考虑蛋白质序列的模式、蛋白质的氨基酸如何相互作用,以及蛋白质可能的三维结构。在这种结构中,一维、二维和三维信息来回流动,从而使网络能够集体推理蛋白质的化学部分和折叠结构之间的关系。
“我们希望这个新工具将继续造福于整个研究界,”UW Medicine 贝克实验室的博士后学者 Minkyung Baek 说。
More information: M. Baek el al., "Accurate prediction of protein structures and interactions using a 3-track neural network," Science (2021). science.sciencemag.org/lookup/ … 1126/science.abj8754
文章来源原创;如有侵权请及时联系PaperRSS小编删除,转载请注明来源。
温馨提示:
为方便PaperRSS粉丝们科研、就业等话题交流。我们根据10多个专业方向(植物、医学、药学、人工智能、化学、物理、财经管理、体育等),特建立了30个国内外博士交流群。群成员来源欧美、日韩、新加坡、清华北大、中科院等全球名校。