“分子并非标准化产品,但机器学习可以训练出分子合成的自动化工具。”
在很多场景中,从结果看AI还只起到了锦上添花的作用,很多行业的痛点并未解决。在安防、金融、政务等应用领域,AI公司竞争激烈,但经济化模型堪忧,寻求新场景的实质性落地是每一家AI公司的严峻课题。这甚至也关乎到助力企业发展的创投机构的切身利益,因为一些即将迎来收获期的被投企业正面临审查标准趋严的科创板和创业板。
生物制药领域是典型存在效率痛点的行业,体现在从新分子到药物规模化生产的几乎全产业链。
制药过程的早期过程是化学层面的分子发现、设计与合成。智化科技Chemical.AI创始人兼CEO夏宁博士对《财经涂鸦》表示,目前化学研发行业的“工业1.0”变革还没有实现,从分子合成到后期生产都基于专家的经验积累,类似手工业。
Chemical.AI智化科技是一家制药化学AI科技企业,它的化学合成路线设计平台让药企能够快速获得新分子,提高新分子合成速率,从而让后续制药环节的探索有更多的可能。今年3月,公司完成了超过3000万元的A轮融资,由红杉中国种子基金领投,巢生资本和天使轮老股东峰瑞资本跟投。
新药发现领域,AI主要应用在靶点筛选、新药分子设计与合成、分子有效性预测上,而用AI辅助新分子设计环节的创业公司数量较多,目前也非常热门。代表公司Schrödinger(SDGR.US)与Relay Therapeutics(RLAY.US)已在美股上市。其中,Schrödinger的分子设计软件收入目前占比达到80%左右。
然而,虚拟的分子在设计出来后,合成的成功率不高,且分子合成后,还要进行有效性测试以筛选出有生物化学活性的分子。以美国为例,资料显示,制药业每年测试数以十万计的分子,但大约只有30个被FDA批准。因此对于有机化学博士来说,他们在新药研发中的一项重要工作就是合成有生物活性的分子,继而研究分子如何影响细胞内的过程。这时也能体现出传统大药厂的优势——更有能力合成并测试数以千计的分子。
Chemical.AI智化科技团队所攻克的则是AI方法辅助化合物合成的解决方案,其客户包括罗氏制药、药明康德(603259.SH;02359.HK)等国内外大型药企及头部CRO。并且,AI辅助实现化合物合成需要有化学反应基础数据、大量实验的经验积累等,壁垒较高。
夏宁从小喜欢编程,深耕化学后,他认为计算机程序可以更好地解决化学研究中的问题,也一直希望将两者结合应用。
从法国科学院有机化学博士学业毕业后,夏宁就开始了算法研发的工作并持续积累。夏宁曾在国际药企研发部门工作,2009年在法国参与创立eNovalys,该公司自研了化合物逆合成系统的早期版本。当时的逆合成系统未成功实现商业化,夏宁回国后继续探索,在2016年上线了逆合成系统的第一个版本,积累了一些用户,随后两年系统的效能不错,证明了此应用方向的前景,夏宁在2018年成立了智化科技专注实现产品的商业化。随着客户的使用,智化科技希望把算法打磨得更精确。据悉,目前公司的软件收入已经使公司盈利。
《财经涂鸦》近日对话了夏宁博士,以下为访谈内容(有删节):
Q:《财经涂鸦》
A:夏宁 智化科技Chemical.AI创始人兼CEO
夏宁(来源:受访者提供)
A:化学是基础行业,但这个行业又与制造业不同,化学的研发一直是“手艺活”,从业人员还是像两百年前的化学家一样手工操作完成实验的工作,没有实现自动化。因为化学的产品是一个个分子,新的分子和之前的分子又是不一样的,不是标准化的产品。化学研发的问题是如何合成几千个分子,生产要解决的是怎样用最便宜的方法生产出目标分子。现在的化学领域,从业者得有高学历、有丰富的经验才能胜任,这是化学的“大脑”;但其他很多行业已经实现了自动化,它们的“大脑”已变成一段程序。同时,我认为计算机程序也非常擅长解决化学的问题。Q:业内很早就开始探索用计算机的方法做合成,为何现在的商业化进展最明显?A:哈佛大学教授Elias James Corey因提出“逆合成分析原理”,将有机合成路线设计技巧变成了严格的思维逻辑科学而获得1990年诺贝尔化学奖。该原理简而言之,就是为了合成某个分子,从目标一步步往回推其原料和合成方法。早在1969年Elias James Corey就尝试用计算机设计分子的合成路线,但当时软硬件条件受限,这类工具没有被广泛应用。后来2018年上海大学的Mark Waller教授和德国明斯特大学的Marwin Segler博士等人在《自然》杂志报道了一款可以通过自主学习有机反应来设计分子合成路线的AI新工具。此套算法被公开后,很多分子合成路线都使用到这套算法的改进版。此后计算机合成化合物便引起了资本的注意,因为运用计算机的方式,化学家可以比以往更快地合成目标分子。化学的文献、专利数据早已实现标准化,数据量也足够大,也非常适合算法的发展。A:如果将药物研发成本降到药厂有利可图,资金会更愿意集中到新药研发中。现在很多做AI的新兴药企聚焦于新分子的设计,但做出的新分子真正合成后并不能被确定为有效,正如设计的芯片并不一定能投产使用。结构过于复杂的分子,化学家也无法合成。因此这些新的虚拟分子通过AI算法的迭代可能在几年后甚至更长时间才能算得准确,但分子的计算机合成是可以更快落地的。我们解决的是快速获得其所设计开锁的钥匙的问题。药企在快速拿到分子后,才能知道它有怎样的效果,从而做出新的管线。A:AI单领域已经体现不出强竞争壁垒了。对于化学家来说,分子怎么做是一套很大又很细分的知识体系,而且化学家有各自精通的领域如糖化学、磷化学等,这样看化学家更像是传统“手艺人”。计算机程序更像是一种GPS的训练体系,它在没有经验的地方也不会受太多限制,因为它会找最好的解决办法,从而加快分子合成过程的探索效率。现在机器学习是按照最高经验水平打造的,可以无限复制自己,同时做很多实验。原来靠人力无法完成的分子合成需求,在AI的辅助下却可以完成。现在,深度学习可以解决很多问题,但还难以解决“逻辑问题”,比如在无人驾驶场景,车辆前方左右两侧分别有一只狗和一个人,如果无法刹车了,它应该撞向哪一侧?这种情况下,目前AI还做不了逻辑判断,需要由专家把规则写好,光靠训练是无法学会逻辑判断的。其实大量的问题都涉及因果关系,这都不是现在的深度学习技术擅长解决的。A:化学里面有大量的因果关系,所以我们做的并不是纯粹基于深度学习的AI,这也是我们可以做、别人不容易做的原因。我们有自己的算法来解决因果关系。与自动驾驶这种场景的复杂性相比,化学的逻辑关系相对简单、可描述。Q:很多场景里AI目前只是一个工具的作用,但我们期望的是AI本身的迭代。A:强人工智能是人类所向往的,但我们对大脑还不够了解,大脑一定是在我们从类人猿到人的过程中进化出了思考决策能力,因为进化过程中我们生理结构的变化远没有逻辑、智力的变化大。我个人认为很重要的原因是人产生了语言,而类人猿没有语言,导致它没法进行逻辑思维,虽然科学界还没有对这一点形成共识。A:AI现在还没法表达出它在想什么,也还没有语言。但凡我们用语言问它再简单的逻辑问题,AI也无法回答。Q:可能AI还没法理解大脑的机制,而且理解了也无法模拟此机制。A:这我倒不这么认为,理解了就可以模拟。其实人的思维就是一段程序,只不过是在大脑神经系统的硬件上运行的。Q:回到化学的场景,公司未来需要持续的资金投入去推动核心的研发能力吗?A:相比于生物医药的后期环节,我们并不需要太高额的研发费用,主要花费是在人才上。人才不仅要有跨学科的能力,还要有持续的研发能力。对于成熟的技术,通过大量资金投入或许可以复制,但如果是我们这些还没有完善的技术,则需要有人创新,需要灵感和试错,这种经验的积累靠“烧钱”可能难以去大规模加速。A:商业模式可以有很多,但我认为提升分子产生的效率是最核心的,因为它的变革性已经足够大了。