单细胞新药研发导论|| 数据之美
男,
一个长大了才会遇到的帅哥,
稳健,潇洒,大方,靠谱。
一段生信缘,一棵技能树。
生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。
❝将单细胞研究的基本思路与新药研发的成熟管线结合起来。
❞
制药行业有着严格的监管和实验审批机制,一直是数据科学深入应用的领域。所有的新药上市之前,都要经过大量严格的临床前后试验以及数据分析。基于有限的实验数据进行建模和模拟,从药物动力学、药效学模型开始并和各种疾病发展模型甚至生存模型整合起来,可以帮助评估和探索新药研发方向,从而降低风险,提高效率。
在化药研发过程中,官能团随机组合的化学空间,已经大于已知的化学数据库。要对如此庞大的数据进行系统性筛选,不仅需要强大的计算能力,更需要优化的数据模型和算法。数据,模型,算力和量化需求,在新药研发中的作用越来越重要,数据也成为新药研发的生产要素之一,并在化药中形成了计算机辅助药物设计这门学科。
在生物药的研发过程中,特别是人类基因组时代以来,组学数据的积累在新药研发过程中的作用也日益凸显。纵观生物药的发展,大体可分为三个阶段:
20世纪60-70年代,生物物理、生物生化和基础医学的发展,人体生物化学和生理过程逐渐明晰 20世纪80年代-21世纪初(2000),测序技术的应用,生物药的起始,重组人胰岛素(基因泰克/礼来)获批上市 2000年至今,生物工程药大规模产业化阶段。基因组学,蛋白质组学,生物信息学等生物技术发展为其提供保障。
多组学数据之于生物新药研发不亚于大数据化学之于化药研发,不同层次的基因测序是打开人体结构的利器,帮助人类加深对生命活动机制的认识,也能为药物治疗提供新的思路和靶标。
海量单细胞技术带来的组学数据超指数增长,为单细胞时代下新药研发提供了新的生产资料。同时,我们看到以机器学习为代表的一系列人工智能技术或者算法日渐成熟。一方面是数据的快速积累,形成大量的图谱和数据库;一方面是数据挖掘算法(AI)需要找到具体的应用场景。所以人工智能和单细胞的结合在学术界和企业界不断见于推文,如:
2020年5月11日,《Nature Communications》“Deep learning enables accurate clustering with batch effect removal in single-cell RNA-seq analysis”。 重磅!晶泰科技与新格元签署AI癌症靶向药研发合作 百奥智汇-百图生科(BioMap)战略合作:共同打造高性能单细胞大数据/AI计算平台
生物信息在新药研发的概念验证阶段的重要性不言而喻,在理论上和数据上为新药研发提供新的启发和指导。现在我们再看新药研发管线中的一期二期临床实验其实依然是以个体为单位的,以个体为单位的实验注定了周期的长和成本的高。而临床试验是不可跨越的部分,在数据和算法不断积累的当下,整体的新药研发管线会不断缩短。单细胞技术和人工智能,可以说是21世纪的当下,照亮新药研发管线的两盏灯塔。
人工智能有强大的发现关系能力和强大的计算能力。在发现关系方面,人工智能可以发现药物与疾病的连接关系,也能发现疾病与基因的连接关系。在计算能力方面,人工智能可以对候选的化合物进行筛选,更快筛选出具有较高活性的化合物,为后期临床实验做准备。
单细胞技术在发现关系方面也有强大的能力:细胞之间的关系(表型)和基因之间的关系(机制)。如在免疫肿瘤学研究中,单细胞分析流程如下:
我想,此刻定有大量优秀的团队在把人工智能和单细胞技术应用在新药研发管线之中。借助人工智能的发现和计算能力和单细胞的通量和精度扩展,新药的研发管线会愈加靠近精准医学的要求。再次回顾现代新药研发管线,我们发现现在是我们距离个体化医疗最近的时候。互联时代的发展让我们体会到数学之美,海量单细胞技术和人工智能的发展会让我们看到数据之美。