研究蛋白质的AI得到了诺贝尔奖级别的重大进展

 2020.12.01 , 17:48

总部位于英国的AI公司DeepMind自开发出AlphaGo以后,已经成为了人工智能领域里的领航者。

然而,有不少人诟病其未能在更加具有应用性的问题里有所突破。

在此背景下,DeepMind的研究人员正在努力让AI解决更根本的重大科学难题。他们使用最新版本的AlphaFold AI引擎,似乎实现了一个雄心勃勃的目标。

大约50年以来,分子生物学家一直猜测,蛋白质分子长链在空间中的折叠结构,是由链上的氨基酸种类和顺序唯一决定的——由此我们就可以按部就班地拼接氨基酸来得到特定功能的酶,或者仅通过小分子的顺序来预测蛋白质大分子的功能,而无需实验——但这并不是一个容易解决的问题。

实际上,潜在结构的数目是如此之大,以至于研究人员推测,对所有可能的分子排列进行采样所花费的时间将超过宇宙的寿命。

但是,如果我们能够解决这个难题(即蛋白质折叠问题),将极大地加快药物开发和疾病建模的能力,并带来远远超出当前想象的应用。

因此,尽管面临挑战,但数十年来,研究人员一直在努力寻找解决方案。

1990年代开始进行了名为CASP(蛋白质结构预测的关键评估)的严格实验,用于检验科学家们设计出的能够预测蛋白质折叠的理论系统。

如今,在CASP的第三个十年中,似乎已经产生了最有希望的解决方案——DeepMind的AlphaFold提供了准确性前所未有的3D蛋白质结构预测模型。

在实验中,DeepMind为AlphaFold使用了一种新的深度学习架构,该架构能够理解和计算3D蛋白质的“空间图”,从而预测支撑其折叠结构的分子结构。

AI系统被喂了大约170000种蛋白质的结构数据,作为培训,参与到今年的CASP挑战中(CASP14),得分为92.4 GDT。

该数值高于通常的湿实验方法得到的结果——90 GDT阈值,而DeepMind表示,其预测平均仅偏离约1.6埃(约一个原子的宽度)。

欧洲分子生物学实验室的基因组学研究员Ewan Birney说:“当我看到这些结果时,我几乎从椅子上摔了下来。我知道CASP多么严格——它基本上确保了计算模型必须从头开始蛋白质折叠。令人沮丧的是,看到这些模型可以如此精确地做到这一点,而我们有很多方面需要理解,但这确实是科学的巨大进步。”

值得注意的是,该研究尚未经过同行评审,也未在科学杂志上发表(尽管DeepMind的研究人员说快了)。

即使这样,即使尚未看到完整的报告和详细的结果,该领域的专家已经赞叹不已。

皇家学会主席,结构生物学家Venki Ramakrishnan说:“这项计算代表了蛋白质折叠问题的惊人进展,而那是生物学有50年历史的重大问题。”

完整的论文尚未发布,但是您可以在此处查看摘要:https://predictioncenter.org/casp14/doc/CASP14_Abstracts.pdf。

https://www.sciencealert.com/ai-solves-50-year-old-biology-grand-challenge-decades-before-experts-predicted

*解释一下大概就是说,蛋白质分子长链上的氨基酸与空间结构的关系,最理想的情况当然是把它转化为物理-数学问题。从更基本的物理特性出发,转为数学模型,然后直接证明,得到定律。如同万有引力可以推导出天体的运行轨迹一样。

但是那个目前做不到。所以只能寄希望于统计-数值模型。就是我们从大量数据里发掘出一个规律性的东西,但是规律的本质我们还不清楚。

AlphaFold就是得到了当前最优的模型。它给出的预测结果,和直接实验测量蛋白质一样好。然后它的计算时间也足够快。

(0)

相关推荐