评论 | Nature Biotechnology:从单细胞RNA-seq到转录调控
编译:艾奥里亚,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
主要内容
单细胞RNA测序是一项强大的技术,可用于测量基因表达随时间的变化,但它不能捕获细胞核中的对应变化,如转录因子的结合以及染色质可及性。Granja等人和Chen等人提出了在单细胞水平上耦合转录和染色质可及性的不同方法。Granja等人设计了一个新的分析框架,该框架结合了关于染色质可及性、表面蛋白表达和基因表达的单细胞数据,并展示了该框架在白血病研究中的实用性(图1a)。Chen等人提出了一种技术,允许测量同一单个细胞核中的基因表达和染色质可及性,并将其应用于研究神经系统的谱系(图1b)。
Granja等人将最先进的统计方法结合在一个分析途径中,从多组学数据中识别癌症特异性调节过程。该方法集成了不同的数据模式,比较了疾病和健康的分子特征,并推断出可能的恶性调节因子。研究人员应用这种方法来定义来自混合表型急性白血病患者队列的样本中的细胞异质性。患者样本之间高度的个体间变异性进一步增加了分析的复杂性。为了探究癌症特异性分子特征,Granja等人开发了一个综合的分析框架,允许对这些复杂性进行详细分析。他们以研究健康骨髓细胞为起始,建立了一个关于DNA可及性、转录组和造血谱系中选定蛋白质表达的单细胞图谱。基于此参考来评估从白血病细胞获得的数据集,将白血病分子特征的不同方面进行解耦,并提取基因调节信息。例如,他们发现RUNX1似乎起到了癌基因的作用,表明他们的方法可能为治疗干预提供新的候选基因。作者期望为不同的病理建立许多类似的多组学图谱。此外,整合的基因表达和染色质可及性数据可能有助于确定特定细胞类型在遗传复杂疾病中的作用。
将特有的算法和集成工具联合使用来产生多组学数据是Granja等人成功的关键。然而,对不同组学数据集进行整合同样也限制了这种方式。通过在相同的细胞上联合进行基因表达和染色质可及性测量,使这个问题得到了有效的解决,这一方式与Chen等人的研究中所论证的SNARE-seq相同。SNARE-seq的主要优点是其简单的设计,该方法建立在常用的液滴微流控单细胞方法的基础上。其将相同的条形码序列并入DNA片段和信使RNA中,从而可以匹配获得基因表达以及染色质可及性的数据。该技术可以被认为是Drop-seq方法的一个插件,因此,对于已经习惯了这种方法的实验来说,设置起来十分容易。SNARE-seq的另一个关键优点是它比类似的方法具有更高的灵敏度。SNARE-seq捕获更多的转录本和多达5倍的可获得染色质位点。由于基因表达图谱可用性的增加可以帮助弥补数据的缺失,这使得该方法更具有优势。
Chen等人使利用SNARE-seq识别可访问的染色质区域,这些区域专用于发育中或成年小鼠神经系统中的特定细胞类型或谱系。为了进一步说明这种方法的优势,他们通过伪时间对细胞进行排序,并研究了染色质可及性和基因表达之间的关系。这一分析确定了启动子可及性和基因表达水平随时间的相似方向变化。该研究还揭示了染色质可及性的变化可以预测基因表达的变化。对存在于差异可及基因组区域中的转录因子结合基序的分析也允许推断负责基因表达变化的转录因子。
作者设想了一些对SNARE-seq的潜在改进。这其中包括灵敏度的提高以及更多种模式的应用,如DNA甲基化或染色质修饰。事实上,在可以用这种数据进行确凿的推断之前,提高灵敏度是十分必要的。核心目标是在相关性分析之上,将基因调控建模为一个动态过程。在能够深入了解特定细胞类型的基因调控动力学之前,仍存在一些挑战,但Granja等人和Chen等人的工作代表了重要的研究进展。随着单细胞的多组学研究产生更多的数据集和分析方法,该领域应该稳步向全面的、系统级的细胞异质性模型迈进。
更多推荐
1 科研 | 基于转录组和调控网络分析揭示了石斛降血糖作用及其机制(国人二区作品)