科研 | Nature biotechnology:sci-fate研究单细胞中基因表达的动态

编译:夕夕,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。

导读

基因表达随着时间、分化、发展和对刺激的响应而改变。然而,目前的技术并不能直接检测到单细胞转录组学的动态变化。本文,作者提出了一种结合单细胞组合索引mRNA标记的方法(sci-fate),该方法使用组合细胞索引和新合成的mRNA的4-硫脲苷标记同时分析单细胞转录组。作者使用sci-fate研究皮质醇反应有关的6000个细胞。根据这些数据,作者量化了细胞周期和糖皮质激素受体激活的动力学。最后,作者开发了推断和分析细胞状态转化的软件。

论文ID

原名:  Sci-fate characterizes the dynamics of gene expression in single cells

译名:sci-fate研究单细胞中基因表达的动态变化

期刊:nature biotechnology

IF:11.51

发表时间:2020.4

通讯作者:Junyue Cao

通讯作者单位:  Department of Genome Sciences, University of Washington, Seattle, WA, USA

DOI号:10.1038/s41587-020-0480-9

结果

1.sci-fate概览

总的来说,sci-fate主要有以下几个步骤(图1a):a.将细胞与4sU一起培养,已标记新合成的RNA。b.收集细胞并用4%多聚甲醛(PFA)固定,然后进行巯基连接的烷基化反应。c.通过稀释将细胞分布到四个96孔板中。第一个sci-RNA-seq分析指数是通过原位逆转录与带有良好特异性barcode与UMI的polyT引物引入的。d. 汇集所有孔的细胞,然后通过FACS重新分配到多个96孔板中。e. 合成了双链互补DNA。Tn5转座后,通过识别5'端Tn5衔接子和3'端RT引物的引物对cDNA进行PCR扩增。这些引物还带有特异性良好的条形码,可引入第二个sci-RNA-seq分子指数。f. PCR扩增子需要进行大规模平行的DNA测序。g. 在映射到mRNA的读段中,通过T→C转换来区分对应于新合成的转录本的每个细胞转录组的子集。
为了进行质量控制,作者首先在以下四个条件下对HEK293T(人)和NIH/3T3(小鼠)细胞的混合物进行检验。所得到的转录组绝大多数是与相似的mRNA回收率相一致的物种。然而,仅通过4sU标记和sh -连接烷基化,作者观察到大量含有T→C转换的reads,即新合成大小的转录本。来源于sci-fate和传统sci-RNA-seq的细胞聚合转录组高度相关,这表明短期标记和转化基本上不会偏向转录计数。
图1 sci-fate使整体和新合成的转录组的联合图谱成为可能

2.皮质醇反应的转录组动力学分析

为了研究皮质醇反应的转录动力学,作者将sci-fate应用于体外模型,其中地塞米松(DEX),一种合成的皮质醇模拟物,激活糖皮质激素受体(GR),它结合到基因组的数千个位置快速改变基因表达。具体而言,作者用100 nM DEX处理了肺腺癌衍生的A549细胞0、2、4、6、8或10 h。在每种条件下,将细胞与4sU(200nM)一起培养2h后收集。然后,作者进行了384×192的科学实验(图1b)。在第一轮索引期间,这64个孔代表了6个条件中的每一个,因此可以在单个sci-RNA-seq实验中处理所有样品,以最大程度地减少批次效应的影响。

在滤除低质量的细胞,潜在的双峰和一小部分分化的细胞后(请参见“方法”),作者获得了6,680个细胞的情况。在比对到内含子(65%)的读段中,新合成的mRNA的比例显着高于外显子(13%)的比例(图1d)。与预期内含子读物最近合成的可能性一致。作者还比较了内含子read和新合成的mRNA用于RNA速度分析,并观察到主观一致的图像,表明它们捕获了相似的信息。在探索这些数据时,作者首先研究新合成的转录组数据和完整的转录组数据是否传达有关细胞状态的相同或不同信息。对整个转录组进行降维处理无法分离未经DEX处理(0 h)与经过DEX处理(2+ h)的细胞(图1e)。相反,将UMAP应用于新合成的单细胞转录组的子集,可以容易地分离未处理的DEX与处理的细胞(图1e)。这些模式可能说明了在DEX处理的细胞中,新合成的转录组更加诚实地反映了GR反应本身。为了说明这一点,与新合成的转录本在0h和2h的比较相比,GR反应的经典标记FGD4和FKBP5表现出最高的诱导率。在相同时间点之间比较整个转录组时被抑制了。

为了对整个转录组和新合成的转录组的数据进行联合分析,作者结合了它们的主要原理成分(PC)进行UMAP分析。此方法将未经历(0h),最近(2h)或长时间(4 + h)处理的细胞分开(图1e)。通过这种联合方法,对应于通过对整个转录组进行分析而定义的两个簇的细胞每个都分为两组(图1f)。检查与细胞周期标志物对应的新合成的mRNA的水平,这些新组中的一对对应于G2 / M期细胞,另一组对应于早期G0 / G1期细胞(图1g)。值得注意的是,根据该联合信息,来自2 h时间点的细胞显示出细胞周期状态的分布(图1e,g)。总体而言,这些分析说明了如何对单细胞转录组的新合成成分和整个成分进行联合分析,从而能够恢复仅从整个转录组中不容易获得的细胞状态信息。

3.TF模块活动分解细胞过程

在这个体外系统中,多个动态基因调控过程正在同时进行。作者推测这些可能被解开,并且通过首先识别与每个过程相关的驱动新的mRNA合成的TF模块来探测它们之间的相互作用。TF模块包括TF及其调控基因之间的候选连接,其鉴定如下:对于每个基因,在6,680个细胞中,作者使用LASSO回归计算了该基因的新合成mRNA水平与859个中每个表达水平之间的相关性表达的TF。在ENCODE数据库中检索到的1086个TFs中,有807个经基因启动子附近的tf结合位点验证,是预期的4.3倍。这些协方差链接通过染色质免疫沉淀测序结合进一步过滤,并补充了通过motif富集分析验证的其他协方差链接(图2a)。作者总共确定了29个TF与532个基因之间的986个链接。

具有一个或多个基因链接的29个TF包括完善的GR反应效应子,例如CEBPB,FOXO1和JUNB。该组还包括以前与GR反应无关的几个TF,包括YOD1和GTF2IRD1,它们在DEX处理的细胞中均表现出更高的表达和活性。还确定了驱动细胞周期进程的主要TF,例如E2F1,E2F2,E2F7,BRCA1和MYBL2。值得注意的是,例如E2F1的TF的表达水平与新合成的水平相比,总体目标基因mRNA的相关性更高。作者还观察到与细胞分化中涉及的TF(例如GATA3)相对应的调节链,这些表达主要在静止细胞的子集中表达,以及氧化应激反应中涉及的TF。

作者基于所有靶基因新合成的mRNA水平的归一化聚合,计算了每个细胞中这29种TF的活性。然后,作者就每对TF之间跨6,680个细胞的活性计算了绝对相关系数。根据层次聚类确定了几个主要的TF模块(图2b)。第一个大型TF模块对应于集合中所有与细胞周期相关的TF,例如E2F1和FOXM1。第二个大型TF模块对应于与GR响应相关的TF,例如FOXO1,CEBPB,JUNB和RARB。其他模块包括一个与GR激活的G1 / G2 / M期细胞相对应的模块,另一个对应于可能分化的GR激活的G1期细胞。其他TF或TF模块似乎捕获了该细胞群中异质的其他过程,包括用于应激反应/凋亡的NRF1和NFE2L2,用于DNA损伤修复的KLF5和用于胆固醇稳态的SREBF2。

为了将细胞周期状态分配给单个细胞,作者首先通过与细胞周期相关的TF模块活性对细胞进行排序。形成了一条平滑的,几乎是圆形的轨迹,其中新合成的与已知细胞周期标志物对应的mRNA的水平是动态的(图2c)。作者观察到了G2 / M晚期和G1早期之间的间隙,这与细胞分裂过程中细胞状态的急剧变化一致。通过细胞周期链接的TF模块内单个TF的活动的无监督聚类,作者确定了跨越早期,中期和晚期细胞周期阶段的九种细胞周期状态(图2d)。相对于细胞周期的其他部分,早期的G1期和晚期的G2 / M期细胞显示出新RNA的合成减少,这可能是由于有丝分裂过程中的染色体凝结所致(图2e)。其他TF模块在细胞周期进程方面表现出不同的动态(图3f)。

类似地,还可以基于GR响应链接的TF模块活动将单元排序为平滑的轨迹。正如预期的那样,该轨迹与DEX处理时间以及与GR反应相关的TF的活性密切相关(图2g)。通过与GR反应相关的TF模块内单个TF的活动的无监督聚类,作者确定了对应于无,低和高激活水平的GR反应状态。

接下来,作者试图探索九个细胞周期状态(图2d)和三个GR反应状态(图2g)的交集。27个可能的状态组合中的每一个都由一些单元格表示,最小的一组对应于整个数据集的1.1%。尽管我们观察到了几个特定于细胞周期和GR反应的特定部分的TF模块(图2b),但一些观察结果支持了细胞动力学的结论。周期和GR响应在很大程度上独立的。

图2 表征驱动单细胞群体中并发动态基因调控过程的TF模块4. 推断的细胞转变预期的动力学

作者试图评估sci-fate的细胞状态转变的分布是否与预期的动力学一致。作者将每个细胞分配到27个状态之一,并计算了一个细胞状态转换网络并假设此实验中的细胞状态转换遵循马尔可夫过程,且转换概率为不随时间变化。(图3a)。通过以下观察可以部分验证这一假设:从最近三个时间间隔(4–6 h,6–8 h,8–10 h)估计的预测细胞状态转换的分布与彼此高度相关,尽管在4h时的细胞状态比例与后来的时间点不同。作为对照分析,细胞状态转换网络的推导方法类似,但基于随机排列的细胞状态转换链接或仅基于成熟mRNA的链接。这些都未能概括细胞周期过渡的预期模式。图4a所示的27个状态分别对应于细胞的子集,其转录组相似,它们利用区分旧(> 2h)和新(<2h)转录本所提供的联合信息(图3b)。

作者是否可以使用此框架更好地了解控制其动力的转录状态的特征?作为第一种方法,作者计算了27个状态中每个状态的聚合转录组之间的成对Pearson距离(图3c)。作为第二种方法,作者将“不稳定性”计算为推断为在时间点之间移出给定状态的细胞比例(图3d)。不出所料,通过此度量,与没有GR激活相对应的状态最不稳定。此外,在高GR激活状态中,对应于早期G1的状态最稳定。这些数据表示与过渡网络一致,其中与高GR激活和早期G1相对应的状态是所有附近状态的频繁“目的地”。

图3 构建gR响应与细胞周期的状态转移网络

结论

sci-fate捕获到了类似于RNA速度的信息,它可以根据转录本剪接状态区分“旧”和“新”转录本。一方面,RNA速度比sci-fate更直接,因为他利用了许多单细胞图谱技术剪接捕获的信息,而sci-fate需要4sU标记,这并不能在所有情况下使用。在另一方面,sci-fate可以进行试验控制,因为4sU标记的时间可控,而RNA速率是内源性剪接动力学的产物,其不可控。此外,正如作者的上述实验设计,新和成的mRNA标记与时间控制的实验设计可以定量分析具有复杂转录过程的细胞。

目前,有两种方法与作者开发的方法目的相同,分别是scSLAM-seq和NASC-seq。他们的区别在于:a.sci-fate使用组合索引的方法,成功分析了6000个细胞中新合成的mRNA,而scSLAM-seq和NASC-seq的细胞数量小于200。b.sci-fate的文库构建成本小于0.2美元/细胞,而scSLAM-seq和NASC-seq都是用smart-seq技术,其文库构建成本为11美元/细胞。c.sci-fate的一个关键特征是作者在大量细胞中进行了原位4sU化学转化,得到高反应效率和低mRNA损失。相反,scSLAM-seq和NASC-seq需要从每个细胞中提取mRNA,并进行纯化和转化。因此,sci-fate在检测地丰度转录本方面表现较好。d.sci-fate的信噪比是20-58倍,而scSLAM-seq和NASC-seq的信噪比只有十倍。e.sci-fate能通过3’标记的UMI直接计数新和成的和已存在的mRNA而scSLAM-seq和NASC-seq不使用UMI计数。sci-fate的其他优势包括与固定细胞的相容性和可以在单个实验中同时处理多个独立的生物样本。

作者发现,尽管sci-fate能够量化单细胞中mRNA的合成,但仍需要策略单细胞中mRNA降解率的方法。

sci-fate可以广泛应用于大多数体外系统,在短时间内研究细胞状态的动态变化,对于长时间研究,可设置时间梯度,如本研究中的实验设计。

sci-fate的一个主要限制是4sU标记使用需要在体外细胞培养模型中进行。然而,最近的研究表明,4sU可以与UPRT-expressing的转基因小鼠在体内进行。表明,sci-fate,进一步优化以提高4sU的检测速度,可以用于体内单细胞转录组动力学研究


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐