利用AI“发现”新药 为研发提速
发现是什么?在数学领域,存在着一个古老的问题,即究竟该说发现了新的数学方法、还是发明了新的数学方法。同样的问题对于现代药物发现也同样适用。在使用人工智能来识别候选药物时,这些新的候选药物到底是被开发出来的,还是通过数学及科学方法在排查过滤之后自然遗留下来的?这些新的候选药物,究竟是被发现的、还是被设计的?这也许是种没有区别的区别。
在本轮发现COVID-19疫苗的竞赛中,人类已经取得一系列进展,也由此产生了使用AI技术推动药物发现的新路径。例如,包括Benevolent AI在内的众多制药企业已经开始应用AI从现有药物中寻找候选药物。在治疗方面,Benevolent AI还公布了进入临床验证阶段的6种分子。除了发现新药之外,Innoplexus, Deargen, Gero, Cyclica, Healx, VantAI等公司也在利用AI技术为现有药物发现新的用途。Insilico Medicine、Exscientia、SRI International、Iktos等公司正在全面使用AI发明新药。世界各地的生物制药公司都在采用AI策略以整合药物发现过程。例如,Atomwise通过深度学习算法与弹性超级计算平台预测潜在药物,借此加快了小儿癌症的分子发现过程,借此缩短可行疗法的发现与开发周期。另外,MELLODY项目则是一套基于区块链的解决方案,旨在开发出一套机器学习平台,能够从药物发现流程中生成的数千种专用数据集开展学习。此项目一旦得到全面开发,研究人员将能够更轻松地确定哪些小分子对未来的研究最有帮助。而这一切,只是人们动用机器学习寻找新药物以及推动医药领域新一轮变革的几个侧面。既然算法完全有能力进行药物发现,我们不禁要问,“药物发现的真正含义是什么?”
结论就隐藏在我们的视线之下吗?
要回答这个问题,我们需要更深入地研究人工智能在药物发现及相关领域中的应用情况,以了解这种新兴技术的实际与商业意义。人工智能在药物发现层面确实有着广泛应用,研究实验室基于这些技术的早期工作成果,将其转化为商业阶段,并据此探索药物开发与可学习算法之间的交集。在此过程中,英伟达公司甚至也参与其中。二者对接的重要载体之一就是计算,即在计算机中“测试”多种分子组合。另一种方法则是从潜在信息中发现洞见,这种方式在药物发现之外的领域已经比较普遍。大数据分析发展出一整套令人兴奋的新技术,能够从现有数据中提取新的洞见。例如,《自然》杂志近期提出的一种方法,就能够评估大型研究论文集中所提及的不同材料及其化学性质之间的关系。在加州大学伯克利分校以及劳伦斯伯克利国家实验室的研究当中,研究人员不再直接查看这些材料的分子数据,而是直接使用无监督学习总结其中的材料学知识,借此发现与功能需求相匹配的材料选择。在新药发现方面,这种新知识就隐藏在视线之下的思路其实非常有趣。2017年,东京中央大学的一位研究人员在《自然》杂志上发表了另一项引人注目的技术,其确定了能够与基因及药物相互作用且显著重叠的一组基因与化合物。使用此项技术,研究人员最终确定了两种有希望的治疗靶标基因,并将其蛋白质产物确定为颇具希望的肝硬化候选药物(一种常见疾病,但却几乎没有好的治疗方法)。
Big Data大数据
根据德勤最近发布的一份报告,药物发现领域的人工智能应用案例确实可以加快药物发现周期并降低药物发现成本。以往,从药物研发阶段到临床前测试阶段,整个周期往往需要五到六年。而再到实际上市则平均需要十到二十年时间,且每种药物的发现及生产成本约为20亿美元。但根据德勤公司的说法,在将新药投放市场之后,预期的投资回报率还不足2%。如果能够将药物发现的自动化程度提高,则制药行业将拥有更加丰厚的利润空间,从而降低新药的上市成本。人工智能无疑是最具前景的新药早期开发解决方案。根据德勤的报告,人工智能解决方案可以显著缩短药物发现阶段的时间需求,将从研发到临床前阶段的周期降低至以往的十五分之一。这类项目需要挖掘大量数据,而且必然涉及大量微调,因此整个过程表现得更像是科学与发现——而非工程与设计。但也许真相实际上处于这两者之间。
发现还是设计?
软件要在人类基因组计划等大规模项目中得到广泛采用,企业全面使用AI技术进行药物发现与研究,甚至说整体药物发现流程都开始由AI软件来驱动,这一切的实现时间可能并不太遥远——大约是在2030年左右。届时,从筛查到临床前测试的周期将大大缩短,而能够治疗极端特定病理的新药也将不再是“罕见的恩赐”。
那么让我们回到主题——人工智能方法究竟是在真正发现新药,还是通过优化流程进行设计?也许答案应该是发现,而非设计。毕竟使用人工智能来发现药物本身就是在“拼运气”,虽然方法本身一直在不断优化,但要想获得“正确”的解决方案仍然需要上佳的运气。这就像不断从工具箱里掏出螺丝起子进行尝试,直到发现一只能够与螺丝对得上。这很有效,但仍然跟发明前所未有的新螺丝起子不是一码事。接下来,我们再问个问题:这是发明还是发现?可以看到,产生新的候选药物的机器模型内部仍然在从数据中学习、做出优化并选择适合的模式。所以,答案仍然是发现。但无论如何,这是个刚刚起步的领域,前景一片大好。我们期待着AI的力量在医药领域得以全面展现!