科研 | Current Opinion in Biotechnology:单细胞时间组学方法的出现和前景
编译:艾奥里亚,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
单细胞转录学能够在单个细胞的分辨率层面下测量复杂生物系统中的基因表达。单细胞数据的多元分析有助于描述胚胎发育、疾病进展以及对应激响应过程中细胞过程的表达变化。同样,新的方法通过测量转录本,同时捕捉关于谱系或分子上过去的信息,扩展了单细胞分析的可能性。这些新兴的方法具有共同的策略,即在静态信息中查询与不同时间阶段相关的信息。单细胞时间组学方法开启了新的可能性,例如推断未来或将过去的事件与现在的基因表达之间相关联起来。本综述中,我们强调了单细胞领域的进展,描述了新的研究工具手段,并考虑了时间组学方法对疾病进展研究的潜在影响。
论文ID
原名:The emergence and promise of single-celltemporal-omics approaches
译名:单细胞时间组学方法的出现和前景
期刊:Current Opinion in Biotechnology
IF:8.083
发表时间:2020年1月
通讯作者:GioeleLa Manno
通讯作者单位:洛桑联邦理工学院(École Polytechnique Fédérale de Lausanne,EPFL)
DOI号:10.1016/j.copbio.2019.12.005
综述内容
在过去的十年里,单细胞基因组学领域通过使用高通量技术来探究复杂的生物系统,并了解细胞是如何变化并对不同的应激做出响应。单细胞RNA测序(scrRNA-seq)可以捕捉单个细胞的转录图谱,而不是依赖于批量细胞测量,从而可以更好地分辨组织的异质性。
单细胞图谱已经被用来构建全面的组织图谱,定义了不同的细胞图谱和标记基因,包括衰老组织和有机体。类似的调查发现,多因素疾病,特别是阿尔茨海默病、精神分裂症和多发性硬化症等神经系统疾病的细微差别更大。巧妙的应用基因表达数据,可以增强全基因组关联研究(GWAS)提供的观点。例如,使用单细胞基因表达信息将与精神分裂症相关的多态性与大脑中的神经元子集联系在一起。
利用scRNA-seq分析动态过程能够表征中间细胞状态。但与活细胞方法不同的是,这些方法依赖于测量的群体内细胞类型之间的变化,而不是通过跟踪单个细胞内的变化来推断细胞轨迹。目前已经开发出评估不同时间方面的方法包括:RNA速度、新生RNA定量、谱系追踪和分子记录等(图1)。
在本综述中,研究者描述了单细胞方法的兴起,它使得基因表达动态的整体检查成为可能。从伪时间轨迹分析开始,重点介绍一些工具,这些工具收集与远程或最近过去的事件相关的信息,或者允许估计单元的未来状态(图2)。这些技术的建立为研究生物系统提供了有效手段,研究者将其命名为:单细胞时间组学,即对单个细胞变化的全基因组研究。在介绍这一领域的进展的同时,就这些新兴方法如何潜在地影响疾病研究提出新观点。
1单细胞伪时间轨迹的推断
除了对分子组织学和细胞类型鉴定有价值外,单细胞方法还可以测量伴随生理和病理过程的细胞的表达变化。从活细胞中重复提取细胞内容物仍处于初级阶段。单细胞基因组学技术由于其固有的破坏性,只能提供采样时的快照。尽管如此,可以通过利用单个时间点组织样本内细胞的共时性(synchronicity)来提取关于全部细胞动力学的信息,其中每个细胞处于动态过程的略微不同的时刻。换句话说,可以通过捕获内部时间的方式对细胞进行排序,以总结典型细胞的表达模式是如何变化的。如果表达谱之间的变异性的主要成分是“发育时间”或“疾病时间”,人们可以使用诸如主曲线、最小发育树、扩散图或主图等算法来总结这种变化并对时间上相关的细胞进行聚类(图2a)。Monocle和Wanderlust作为最早的轨迹推断工具,它引入了伪时间的概念(根据基因表达数据的分布来估计的一种变量,用作代表生物现象中的细胞进展),同时,越来越多的轨道推断算法正在开发中。
轨迹推断方法在复杂性和精确度方面有所提高,但在描述产生观测的动态过程的能力方面仍然存在显著的局限性。虽然这些工具假设表达谱之间的变异的主要成分是时间相关的,但是基因表达的变异可能是由多种因素所引起的,这些因素包括空间模式、组织结构和形态发生梯度等。在这些其他机制与时间变化混合的情况下,传统的轨迹方法可能会超出这些混杂因素。为了让轨迹推断方法能够更好地应用,实验应该从细胞状态随时间的分布中获得一个平衡的样本。然而,偏向更稳定或缓慢变化的状态可能会导致瞬态被扭曲或遗漏。虽然这一限制可以通过改进的胚胎学实验设计来抵消,但在研究不太协调的过程(如疾病的进展)时,这就更具挑战性。
当伪时间不偏离真实时间的过程时,它与基因表达的关系可以提供有价值的生物学见解。值得注意的是,这样的模型应该被解释为描述统计预期,而不是细胞所发生的真实路径;单个细胞可能在基因表达空间中围绕平均值来回波动,因此不应该期望伪时间分析揭示实际的路径。轨迹推断是一种方法,其中从数据的协方差结构估计潜在的时间分量,从相似的细胞收集期望,并将基因表达作为该潜在变量的函数进行研究。新的方法,如RNA速度和分子记录,正开始通过从单细胞测量获得的信息估计动力学来解决这一限制。
2 RNA速率与未来基因表达状态的估计
生物化学家Jacques Monod于1952年在酶反应的背景下提出了使用两个细胞实体之间的因果关系来模拟生物过程的速率。Monod 描述了一个一阶微分方程用来表示Escherichia coli中的酶合成的速率,其假设合成酶量与生物物质总量的比率是恒定的。这些概念在微阵列时代被Zeisel等人重新审视以探究RNA表达动力学对急性应激或对时间循环的背景下(如在生理周期期间)的响应。由于细胞内未拼接mRNA的数量决定了未来拼接的mRNA的数量,因此可以写出一个速率方程来描述mRNA积累的变化率。这一想法被应用于单细胞生物学中的RNA速率,即在scRNA-seq协议中使用内含子读取来区分未拼接和拼接的RNA分子。RNA速率假设为基因特定的恒定拼接和降解速率,并将细胞拼接的RNA丰度与预测的稳态水平进行比较,从而推断mRNA表达的增加或减少的速度。RNA速率已被用于发育方面的研究,并用于描述人体组织的病理变化。最近还提出了一种测量蛋白质速度的方法,该方法利用拼接RNA水平来推断蛋白质丰度,并估计基因表达和蛋白质合成的变化率。这个算法利用了可以同时测量单个细胞中蛋白质和RNA表达的方法,包括CITE-seq、REAP-seq、SPARC和其他方法(图2c)。但目前这些方法仅限于几十个细胞表面标记。
在未来的研究中,研究者预计,对基因表达变化率的增强估计将受益于测量新生RNA或染色质状态信息的能力。NASC-seq和SLAM-seq能够通过硫醇连接的烷基化和碱基转换来区分旧的RNA分子和新生的RNA分子。这些方法既可以标记未剪接的RNA,也可以标记剪接的RNA,并允许在区分这些新老RNA的同时,定量新合成的分子和较老的未标记分子,从而导致对四个不同的RNA群体的测量。
多组学方法的增加为将细胞额外的特点与基因调控的RNA表达动力学之间联系在一起提供了机会。多组学分析可以通过整合评估不同细胞动力学的几个数据集或通过在同一细胞中联合测量来实现。最近的单细胞技术使RNA表达与染色质可及性、转录因子结合、蛋白质表达和DNA甲基化的联合图谱成为可能。此外,流行的批量方法可适应于单细胞层面上,这预示着未来应用多组学的可能。研究者最终设想了许多推理方法,这些方法将结合RNA速度和多组学分析,以允许将生物过程建模为更接近真实时间的潜在变量的函数。
3 记录克隆信息和过去的转录状态
传统的谱系追溯技术通过标记一组给定细胞的后代来探测单个细胞的有丝分裂亲缘关系。在现代单细胞基因组学时代,谱系追踪技术作为代表技术,主要是一种在能够探测基因表达的同时提供有丝分裂亲缘关系信息的技术。这可以使用可诱导的记录系统来实现,在该系统中,条形码被合并到基因组中,并通过测序或基于成像的方法被识别(图2b)。具有相似条形码的细胞被认为具有克隆祖先。大多数基于测序的谱系追踪工具是利用CRISPR/Cas9系统对转基因位点的基因组“scars”进行编码,因此细胞和mRNA表达谱的标记都可以通过scRNAseq来测定。
大多数谱系重建工具的一个缺点是基于目前观察到的细胞表达变化,未观察到这一变化的过去细胞状态特征的特定信息,而过去表达谱系或信号事件的人工或分子标记对于研究特定转录事件的因果关系是有用的。例如,MEMOIR可以直接记录如信号通路激活在内的细胞事件,并可以通过使用顺序的单分子FISH直接读出表达。或者说,CAMERA可以通过使用CRISPR/CAS9来记录哺乳动物细胞培养系统中信号事件的持续时间。
研究者设想未来的转录组记忆工具,可以记录有关过去基因表达谱的信息,以便以后进行测量。这一概念的灵感来自分子记忆的自然现象,即原核细胞调节细胞成分的半衰期和周转率,以提供对环境压力源的抵抗力。Record-seq捕获表达的细菌RNA序列,使用基于CRISPR/CAS9的间隔区采集系统将其转换为DNA进行存储,并通过深度测序进行检索。研究者期待着在真核细胞中开发类似的转录组记录工具。此外,与传统的基于测序的方法相比(传统的测序方法牺牲了空间信息,有利于增加复杂性),保留组织中细胞的空间组织的分子记录将允许更准确地重建发育历史和细胞相关性。
4 时间组学在多因素疾病研究中的应用
当使用当前的方法来捕捉组织改变并识别表征疾病起始和发展的失调时,存在一些障碍。这些挑战包括疾病的缓慢发作、从不同患者采集的样本的脱节性质、样本的稀缺性以及疾病过程的个体间变异性。但新的工具为缓解这些限制因素提供了可能性。
虽然对遗传病缓慢发作过程中的种间细胞状态进行收集有助于最终的病理表型,但目前却很难收集到这些数据。此外,如果两次测量结果相隔很远,有可能表现出明显的批次效应,因此如何在发病过程中进行取样同样存在挑战。然而通过创建一个分子记录系统将很好的解决类似的问题,该记录系统允许收集单个样本中过去和现在的表达信息。在动物模型中,这样的工具可以使用Frieda等人所描述的“scratchpad”来实现,该“scratchpad”允许像Chan等人那样通过基因组测序来读出。在缓慢发展的疾病模型中,细胞可以在发病过程中在“scars”中积累信息,然后读出。或者说,一种引入突变体或基因敲除的有针对性的技术并通过scRNA-seq对结果进行读取,将探索过去和现在表达状态下的细胞现象的因果关系联结合在一起。但由于这些方法需要转基因系统,因此这些方法不能应用于患者样本。尽管如此,研究者仍然可以在动物模型和人类器官中使用记录工具来更好地理解与发育相关的复杂的非孟德尔遗传疾病。
由于不需要对基因进行修饰或改造,因此测量RNA和蛋白质速度的方法有更直接的适用性,并可以应用于活组织标本。这些方法可以将当前的细胞状态与正在进行的病理驱动的表达变化相关联,从而能够潜在地实时监测组织病理生理学、对化疗的响应,甚至预测移植器官排斥反应的发生。由于RNA速率预测在未来的范围内是有限的,这种方法仅限于相关关系变化迅速且一致的情形。尽管如此,最近关于衰老组织的研究已经成功地应用速率来比较老干细胞和年轻干细胞在基因表达空间中的过渡。
时间组学方法也可以帮助监测感染期间宿主与病原体的相互作用。这个用例已经使用scSLAM-seq进行了探索,它区分了早期和晚期新生RNA,以计算修正的新生RNA对总RNA的速度。在感染巨细胞病毒的细胞中使用这些速度可以发现基因调控的变化,否则很难检测到。在未来,RNA速率方法可以更精确地评估对抗病毒或抗菌药物治疗或疫苗有积极反应的表达变化。
总结
单细胞转录学的第一个探索阶段专注于复杂细胞类型的鉴定和分类,为发育和疾病的异质性提供了有价值的见解。第二阶段的兴起,其特点是采用实验性的清晰的方法,就时间方面的生物机制提出更复杂的问题,表明单细胞领域从描述性向预测性的转变。时间组学技术正在推动整体多组学问题研究方式的概念性变化,提供了一种联合测量方法,人们可以从中拟合动态模型或进行因果推理。
虽然大多数细胞状态评估技术都假设生物系统是确定性的,但现实中疾病的发展和发病涉及随机事件和基因表达噪声。未来用单细胞组学数据模拟多变量过程的努力可能会带来有趣的见解,并将该领域推向单细胞生物学的未知领域。
时间组学技术的一个值得注意的应用是减轻并最终缓解当前单细胞轨迹方法在疾病研究中显示的缺点。研究人员预测,对病理的更深入的理解以及改进的治疗策略的发展可能最终取决于过去细胞状态的解开,目前的单细胞测量,以及来自同一个单细胞的未来细胞命运。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响