Nat Biotechnol:人工智能药物研发在中国蓬勃发展
中国的新兴企业和IT巨头希望将该国的人工智能实力转化为世界领先的药物创新。他们比西方玩家更有优势吗?
中国研究人员正在讨论人工智能(AI)在药物设计和开发中的潜力。就在上个月,三家中国制药商筹集了巨额资金,为他们的药物研发计划提供资金。总部位于香港、全球业务一半在上海的英硅医学(insilicon Medicine)筹集了2.55亿美元,用于推动其人工智能发现的候选药物进入临床试验,并调整其算法,以发现新的靶点。此前,北京StoneWise Technology在4月份获得了1亿美元的收入,总部位于深圳的XtalPi在去年9月增加了3.19亿美元的收入。
中国政府的监管改革旨在促进人工智能驱动的药物发现
腾讯、百度和比特登等IT巨头也在将其强大的人工智能能力转向药物设计。中国的人工智能公司制定了雄心勃勃的国家战略,目标是在人工智能领域占据主导地位,拥有大量人工智能研究人员人才库,有大量的合同研究组织(CRO)与之合作,以及不断完善的健康数据隐私保护,因此中国的人工智能公司准备在全球竞争中更快、更便宜地生产更多药物。但即使14亿人口能够提供丰富的数据,使中国人工智能公司领先于西方同行,用于训练公司算法的临床前和临床数据的质量仍然存在问题。
Insilico Medicine的创始人兼首席执行官亚历克斯·扎沃龙科夫(Alex Zhavoronkov)说:“如果你来到这里,看到发生了什么,就会给你留下深刻印象。”。北京一家投资人工智能公司的风险投资公司Sinovation Ventures的首席执行官李开复(Kai Fu Lee)同意这一观点:“中国确实有能力建立药物发现系统。”
但中国的人工智能药物猎手是后来者。在过去的十年里,像Atomwise、BenevolentAI(伦敦)、Exscientia(牛津)、Relay Therapeutics和Numerate这样的公司都在与跨国制药公司进行大交易。就连目前与中国Insilico Medicine和XtalPi有关联的两家最著名的人工智能药物设计公司也于2014年在美国成立。当时,中国的人工智能药物研究进展缓慢。”2015年,当我第一次回到中国并开始与中国制药公司交谈时,很明显,他们中的大多数人对药物研发方面的人工智能不感兴趣,或者还没有做好准备,”XtalPi联合创始人马健说。
然而,从那时起,情况发生了迅速的变化。AlphaGo在2016年和2017年战胜顶尖的人类围棋玩家,让业界关注人工智能在许多中国年轻人心目中成为成功之路的潜力。第二年,中央政府启动了一个雄心勃勃的框架,使中国在2030年成为AII的全球领导者,这导致了新的大学培训项目。
大约在同一时间,中国的监管改革促进了创新药物的发现,包括基于人工智能的药物发现。2015年更新的生物等效性规则和新的批量采购规定意味着创新药物越来越受到非专利药的青睐,而非专利药此前曾主宰中国药品市场。新规则使天平倾斜,有利于最快、最具前瞻性的制造商。这就产生了对新管道的巨大需求,同时也引发了人们对人工智能能提供什么的好奇。例如,2019年,汉索制药集团同意向Atomwise支付可能超过10亿美元的费用,以设计针对多达11种癌症和其他疾病相关蛋白质的药物。虽然XtalPi的大部分合作资金来自美国公司,但中国现在是其增长最快的市场。”对于缺乏创新经验的(中国)公司来说,人工智能代表了一种跨越式发展的方式,”马云说。
中国的研究人员回应了这一呼吁。在一场“活动风暴”中,计算机科学家、物理学家、数学家和传统药物发现研究人员发起了50多个人工智能药物发现公司,张健说,他在上海交大办了一个分子设计实验室,并与一些AI药物设计初创公司合作过。2019年,张帮助将总部位于上海的Nutshell Therapeutics重新定位为一家人工智能药物设计公司。Nutshell Therapeutics在6月份刚刚筹集了第二笔2000万美元的资金。2018年,百度搜索引擎发展背后的关键力量周杰龙成立了StoneWise,帮助发现小分子药物。
美国的业内人士和药物发现研究人员仍然对人工智能的宣传持怀疑态度,并声称一旦药物项目达到人类概念验证研究,人工智能可以提高消耗率。中国研究人员认为,鉴于这种保守的想法,中国公司可能比西方公司更快地利用向人工智能的转移:“中国没有传统的发现方式,因此没有盒子。这些人脑子里没有其他规则,”Nutshell的联合创始人俞正田说,Nutshell利用人工智能预测疾病靶点的变构特性。
中国庞大的人口和庞大的医院使得聚合大型数据集变得容易——这是人工智能培训的关键要求。在中国,对隐私的关注也较少,这意味着数据更容易获取。Lee说,美国的人工智能公司尤其受到监管的束缚,比如1996年的健康保险便携性和责任法案,该法案为电子健康记录的共享设定了标准。Lee说,HIPAA使得收集数据变得困难,即使患者已经同意。李说,尽管中国政府即将对出售泄露的个人数据的人实施严厉惩罚,但像宜都云这样的公司正在兴起,以确保数据能够被访问。宜都云将患者同意的数据整合到一个研究工具中。他们在美国Flatiron Health、Tempus、Aetion和Palantir的同行也在大规模整合真实世界的电子健康记录数据,以用于药物发现。
但许多数据质量很差,这可能误导人工智能。”数据质量绝对至关重要。大多数从事药物研发的中国公司都没有很好的培训数据,”Ye Tao说,他是北京大学深圳研究生院的一位药物化学家。
张同意数据质量是一个问题,特别是在北京和上海等少数医学研究中心之外。”可能只有在大城市才能获得好的数据。这有点复杂,”他说。
中国强大的人工智能研究人员队伍,包括来自美国和欧洲的回国人员;百度、阿里巴巴和腾讯的工业研究老手;而那些在支持国家长期人工智能目标的新政府项目下接受培训的人也应该给国家的行业带来竞争优势。根据斯坦福大学最近的一份报告,在全球的人工智能研究论文中,中国的研究者占总数的22.4%,相比之下,来自欧洲的16.4%和美国的14.6%。去年,中国的人工智能出版物获得的引文首次超过美国。李说:“中国仍然缺乏能够取得根本性突破的科学家,这些科学家占论文总数的1%,特别是被高度引用的会议论文。”当涉及到真正最具创造性的开箱思考者时,美国仍然领先,”他说。
但这对药物发现可能并不重要。中国公司可以修补基于生成性对抗网络或生成性合作网络的人工智能算法,其中大部分是在美国、加拿大或欧洲开发的,因为它们通常是开源的,并且可以公开访问。”你改变了几个词,也改变了整个概念。你可以找到解决问题的方法,”Nutshell的Yu说科学来自那里[西方],但技术来自这里。”
李开复表示,中国人工智能药物研发的方法也可能更加务实,他认为这给了中国优势。谷歌的子公司DeepMind可能会获得诺贝尔奖或图灵奖,但他表示,中国公司“在人工智能货币化、利用人工智能创造价值、利用人工智能构建新产品方面做得非常好。”。
然而,人们对人工智能的兴趣和机会的爆炸式增长推高了工资,也使得保留专业技能变得困难。Zhavoronkov说,中国顶尖人工智能专家的成本高于美国,而且往往四处走动。Insilico主要在中国大陆以外聘请人工智能专家。Insilico的研究范围从生物学假设和新生物目标的识别,到候选分子的生产和测试,主要在中国大陆以外聘请人工智能专家,并更倾向于中国后期化学设计和分子生产方面的研究,而中国在这两个领域表现出色。”我们做地理套利,”他说。
Zhavoronkov 表示,中国的 CRO 数量——总共约 3,000 个——可能是中国人工智能药物研发公司最具吸引力的方面。 Insilico 正在与其中的 80 家合作。 这使公司能够避免与学术机构合作时会发生的时间和知识产权损失。 它还允许在多个 CRO 的开发链中并行运行多个实验。 Zhavoronkov 说,比较结果“对你的人工智能来说是一次巨大的学习体验”。
Zhavoronkov 说:“你有大量的实验室可以以合理的成本为你执行所有实验,但同时并行。” “唯一能做到的地方就是中国。”
到目前为止,与西方同行一样,Insilico 和 XtalPi 已经达到了一些临床前里程碑。 Insilico 发现了一个与特发性肺纤维化相关的生物靶标,然后从头开始设计了一种“新型”分子——至少对于知识产权要求足够新颖——以匹配该靶标并可能治疗该疾病。 根据该公司的新闻稿,这一壮举耗时不到 18 个月,仅耗资约 200 万美元。 这只是这些阶段通常成本的一小部分。 根据 XtalPi 的新闻稿,它与 Signet Therapeutics 的合作在六个月内确定了一种胃癌治疗方法。 该公司表示,它现在正在走向临床试验。 上海交通大学的张说,他研究的两种化合物正在等待批准开始临床试验; 他预计其中一项试验将于明年开始。 Yu 说,与此同时,坚果壳公司的肿瘤学候选人距离临床试验还有几年的时间。
但与其他地方一样,中国人工智能药物设计的成功将取决于其候选药物是否能在临床上取得成功,这是人工智能设计的药物尚未实现的。 新墨西哥大学的计算生物学家 Tudor Oprea 说:“有很多炒作,很多人试图向你推销根本不存在的东西。” “布丁的证明在于吃。 所以你真的不知道,直到它上市。”
“有很多炒作,很多人试图向你出售根本不存在的东西。”
Oprea 说,他成为科学顾问的 Insilico 是一个很有前途的模型,因为它采用“端到端”验证过程,而其他许多模型只着眼于拼图的一小部分,因此很难知道 AI 是否给出了有意义的结果。 “有很多窄带视觉,”他说。
腾讯、百度和字节跳动进入人工智能药物发现领域,将为中国的努力增添分量。 2020 年 7 月,腾讯推出了自己的人工智能驱动药物设计平台 iDrug。 它已经启动了十多个项目,包括寻找对抗冠状病毒的药物。 该公司计划涵盖临床前研究、预测蛋白质结构、筛选候选药物、设计和优化分子以及表征蛋白质功能的各个领域。
Lee 表示,这些 IT 巨头将扮演中国版的谷歌,生产像 DeepMind 这样的大型机器,可以解决蛋白质折叠等问题,这些问题需要比小型初创公司更多的计算能力。 “所以现在我们有一些小而灵活的公司,它们可能更务实,赚钱更快,然后是大巨头,”李说。 “所以这是一个很好的分工。”
虽然中美之间存在一些良性竞争,但许多研究人员更担心当前的政治紧张局势可能会损害两国在这个新兴领域的协同效应。 中国人工智能药物设计的大部分投资来自美国,而有影响力的人工智能会议论文的作者中有三分之一在中国接受教育,但大部分在美国工作。 “所以我真的希望医疗保健或药物发现不会成为这种脱钩谈话的一部分,因为这项研究完全是为了人类的利益,”李说。
作者:日本京都 大卫·西拉诺斯基