图 | 基于图谱的管线批量开发模式(来源:百图生科官网)根据公开资料显示,百度底层深度学习算法平台飞桨,将会为百图生科的生物计算平台提供 AI 底层技术和开发工具支持。而百度作为善于处理海量数据、知识图谱,具有巨型数据中心布局的 AI 平台公司,预计也将在底层架构上与百图生科产生协同。通过对百图生科投资、合作的分析,可以看出百图生科从基因组学、蛋白质组学、转录组学、代谢组学等各个维度,在单细胞尺度上建立了数据分析的能力。今年 1 月,百图生科先后完成了对单细胞技术平台百奥智汇的投资和共建 AI 单细胞分析平台的战略合作,并与基因组学公司普瑞基准建立了肿瘤领域多组学战略合作。不久前,又与易毕恩科技建立了围绕表观遗传学的多组学战略合作。这几家公司的创始人张泽民教授、梁晗教授、何川教授都是对应领域的顶级学者,百图生科的野心可见一斑。刘维强调,百图生科正在重点搭建生物计算生态体系。一方面,围绕生物计算引擎,和大量前沿技术伙伴合作,与其合作研发实验技术、细分领域算法、细分领域知识。同时为伙伴带来落地场景、研发经费、多种技术协同整合的机会,并对需要的公司进行生态投资。另一方面,依托生物计算平台和新药发现能力,通过技术 + 投资,与主流药厂和创新药厂进行 “Co-development”,高效推进创新药物临床进展。
图 | 百图生科投资生态圈(来源:百图生科官网)在这种模式之下,百图生科的商业模式,是基于知识图谱合作开发多个创新管线以及精准诊断产品。“与单一管线公司相比,我们希望能通过新的方法学平台,批量产生创新管线,并与伙伴更大比例地分享任何一个具体管线的利益。” 刘维说。目前百图生科还没有对外披露其靶点挖掘和药物设计的实际进展,近期将逐渐公布一些和大型药企的合作。此外,百图生科已在开展生物计算引擎建设,今年底部分知识图谱可能即会问世。“今年是造药新势力元年”“与局部技术的改进不同,以生物计算为引擎重构完整药物研发链条的机会正在到来。今年是以生物计算驱动的创新药产业元年,我们正处从用技术和数据零部件服务主流药厂的先导期,迈向全产业链重构、开发创新计算药物的主战场”。刘维说。“在过去 20 年,行业内的数据和技术加速发展,未来的生物计算是新数据 × 新计算 = 新的药物研发战场。新战场上不再只是用生物行业原先积累的数据,需要高投入的数据生产,高复杂度的数据又需要高投入的算力和算法。这是一场大投入的战斗,但机遇在于人类社会对新药物的强烈需求,行业没有天花板,远比造车还更加有想象力。” 刘维补充道。近年来,一些 AI + 制药公司在融资和研发方面取得重大进展。自 2020 年 3 月以来,全球共有 11 家 AI 制药公司完成了 1 亿美元以上的融资,今年更是诞生了全球 AI 制药领域单笔最高4亿美元的融资纪录。而在研发进展上,头部玩家之一 Insilico Medicine 利用 AI 发现的候选药已经有望进入临床。
图 | 融资金额及数量 (来源:CB Insights 中国)“第一批 AI 药物设计公司成功证明了 AI 技术在已有数据积累的药物设计领域作为效率工具的可行性,也诞生了很大的商业价值。我们眼中更大的空间还在今天药物研发公司未涉足的无人区,3-5 年内希望会为行业带来极具创新性的新药管线”,刘维说道。如何抢占这片 “无人区”,分取万亿美元级精准药物市场份额?刘维认为,需要突破四大技术门槛。首先,需要高性能的生物计算引擎。真正的生物计算应该有极高的计算先进性,这样才能实现和主流药企的能力互补。例如,面向生物数据的超大规模预训练需要成千上万个核的庞大算力支持和架构优化,高效挖掘高维、动态、细颗粒度新组学数据的基础是自主研发的高性能图数据库,蛋白药物设计离不开自主研发的生物计算芯片。干湿一体的生物数据生产能力也同样重要。在生物计算时代,我们将建立自主的干湿一体生物数据平台,就相当于自动驾驶的测试车 ,在生物实验数据采集 — 生物计算挖掘 — 生物实验验证的高通量闭环中才能产生足够的数据。其次,靶点挖掘 — 药物设计全流程的闭环能力也尤为重要,只有具备闭环能力才能建立端到端的迭代能力。最后,也是必不可少的一点,“造车新势力”需要共同进行生态建设,并且保有长期主义的决心。-End-