Single cell RNA-seq 方法篇-上

首先我们先来回顾一下上一期讲到的Single cell RNA-seq 的原理,首先是2006年末端加A形成第一链cDNA的方法奠定了后来的单细胞转录组测序的问世,2009年,二代测序的发展结合末端加A的思路成就了第一篇单细胞转录组文章,2011年富集5端的带细胞Barcode的模板转换法原理启发了之后一大批单细胞转录组方法的建立。2012年,全长cDNA的单细胞转录组方法SMART-seq出现,同年,应用T7启动子的体外逆转录(IVT)方法CEL-seq被报道。

■   ■   ■

今天我们要讲的是由这些原理所衍生出的各个方法,以及他们之间的联系,由于涉及的单细胞方法较多,方法篇我们分为上下篇。

今天这一期主要讲上篇,末端加A和体外逆转录(IVT)两类原理所衍生出的方法,在之后的下篇,将总结基于模板转换的各个方法。

【首先是基于末端加A的原理】

2013年,Quartz-seq被报道于Genome Biology,基于前面的单细胞方法,主要优化了三点:

1. 极大降低PCR副产物(主要为引物二聚体)

2. 使用一种高效的酶来来适应于单管反应3.优化了反转以及cDNA第二链合成的条件。

且文章一直强调可以区分细胞的异质性,甚至是同一细胞类型的同细胞周期的细胞基因表达的异质性,这是在前面的文章所没有涉及的分析。

由于没有看到有详细介绍该方法的推文,但是文章里提到的一些改进建议对实验来说可能会有些启发,这里就详细解读下。

针对副产物引物二聚体这一点,方法在反转那一步,最大降低了RT primer的浓度,并使用exonuclease I,将多余的引物清除,这一操作在2006年那篇文章已经用到,且被后来的很多单细胞方法使用。

针对漏网之鱼的没有被外切酶消化的引物,这里应用到抑制性PCR的方法(suppression PCR,1995年发表于Nucleic Acids Research,已经累计被引1400多次)由流程图可以看到,左边一竖排是mRNA到cDNA的过程,而右边的一小竖排是没有被外切酶消化的漏网之鱼primer,他们同cDNA一链一样在tube里经历同样的反应,末端加A,然后合成自己的二链。

当使用扩增引物扩增双链cDNA时,变性后的单链引物副产物在退火时,由于其片段较短,其一端和自己另一端杂交的速度会高于和扩增引物的杂交,因此,副产物会自己先自杂交形成“平底锅”结构而不受扩增引物扩增,这一前提是自己的两端正好互补。而cDNA由于链较长,会先和扩增引物杂交。

可以看到,二链合成那一步的primer和一开始RT的primer有一部分是一样的,以方便自杂交。同时为了提高自杂交效率,文中缩短了末端加A的时间,使非首尾配对部分(红圈处)尽量短,以提高首尾碰面的效率。同时,文章还发现利用topoisomerase V会抑制副产物形成。由于降低了副产物,也就不需要进行切胶回收,并可以一直保持在一个tube里。

另一方面,文章使用MightyAmp DNA Polymerase(商业化的是Clontech的Terra PCR Direct Polymerase)作为单管反应的最佳酶(当时)扩增cDNA,可以提高cDNA的产量,因此也可以减少PCR的循环数。在之后的文章里应该会再次提到这个酶,笔者在扩增cDNA的时候目前用的也是它,当然也有一些其他优秀的酶,如KAPA HIFI酶。

今年,该方法的进阶版Quartz-seq2被报道,这篇文章主要有两个要点:

1. 单细胞发展到2018年,当然是做高通量,加上UMI和细胞Barcode;

2. 针对目前单细胞测序的一个局限,就是一般3000-4000个细胞测一个lane,分配到每一个细胞的reads就比较少(当然土豪可以测3个4个lane),由于一般reads转UMI的转化率只有10%,于是转化出的UMI的数量就会比较少,而文章优化后(主要优化末端加A的效率)可以达到30%-50%,来满足低拷贝基因的发现。

这里作者试验了各种不同的末端加A反应的buffer,并使用了其中最优的,cDNA量提升2.88倍,并且在二链合成的步骤使用逐渐加热的方式(每秒提高0.2摄氏度到68度,MALBAC中也用到逐步升温的策略),同时试验了一系列不同浓度的RT酶,找到在保持高效率的前提下最少的酶量达到省钱的目的。自此,也就对2009年的第一篇单细胞文章做了个全方位的优化。大家可能想,既然末端加A的方法有优化,是否针对模板转换原理的也有针对各个条件体系优化的呢,当然有,在下期模板转换的时候会讲到。

我们再来简单了解下该原理部分的其他的方法。

时间回到2015年,SC3-seq(single cell single-cell mRNA 3-prime end sequencing)由日本京都大学的一个研究组所报道于Nucleic Acids Research,沿用2009年的方法,并列举了一些扩增全长和UMI的局限性来主打富集3端测序。同年,Genome Biology报道了SUPeR-seq(如图),方法使用半随机引物(T引物连接随机引物)来抓取polyA(+)(-)的RNA,同时该引物还会减少3端偏好。对于polyA(-),文中特别强调CircRNAs。方法中通过ddATP来终止末端加A(dATP)(双脱氧链末端终止法),文中优化了ddATP同dATP两者的比例使加A链长度达到相对最优,太长影响测序质量,太短影响二链合成效率。幸运的是该方法对rRNA的扩增偏好较小。

2017年,multiple annealing and dC-tailing-based quantitative single-cell RNA-seq (MATQ-seq)发表于NATURE METHODS,这篇文章非常值得一读,文章将自己的数据同低通量的单细胞转录组方法的金标准SMART-seq2做对比,依旧有过之而无不及。文章使用primer mix(如下)对total RNA进行反转

GATdT primers:反转poly(+)

GTGAGTGATGGTTGAGGATGTGTGGAGN5T20

MALBAC primers:反转poly(-)

GTGAGTGATGGTTGAGGATGTGTGGAGN5G3;

GTGAGTGATGGTTGAGGATGTGTGGAGN5T3  

在第一链合成应用到逐渐加热的方式,并采用不变性的10次循环退火步骤来达到充分高效的合成一链。

之后对于第一链cDNA,这里采用了末端加C的策略,然后再加入MALBAC primers,合成二链。

文章中提到末端加C同G碱基丰富的MALBAC primers可以达到更高效的第二链合成,另一方面,在2013年发表的HTML-PCR就是通过末端加C高效扩增DNA。最后对于双链cDNA,使用GTGAGTGATGGTTGAGGATGTGTGGAG进行扩增,最后建库。

此外,对于rRNA,在SUPeR-seq中,由于也有随机引物,但意外地获得rRNA的量很少,这篇给到了一个方案,采用duplex-specific nuclease (DSN) 来去除来自rRNA的大部分cDNA。

【下面是基于体外逆转录的方法】

这里我们有所侧重,对于该原理提到的方法将大致了解下,CEL-seq2在上一篇推文有所提到,CEL-seq2优化了反转引物的长度,并使用SuperScript II Double-Stranded cDNA Synthesis Kit来进行一链,二链的合成(上一篇推文有同学问到二链合成的问题,这里介绍下,cDNA第二链合成的原理是用RNase H使RNA-DNA杂合链中的RNA产生切口,再用DNA Polymerase I通过切口平移(nick translation)反应进行RNA链取代合成cDNA第二链)同时优化了后期的建库方式。

这里直接来到2014年发表于SCIENCE的MARS-seq,可以看到,该方法侧重的是高通量,原理都是反转后形成一链再合成二链cDNA(使用second  strand synthesis kit (NEB))然后对其进行体外逆转录线性放大,之后建库的方式和CEL-seq相同和CEL-seq2不同(CEL-seq2通过带测序接头的随机引物去反转逆转录的RNA将测序接头引入片段),这里分了两步,先使用带已知序列接头的ssDNA(图中橘黄色片段)同逆转录出的RNA连接,然后再反转获得DNA来引入测序接头。

inDrops当然采用同样的原理,但是将反应腔室从tube换到Drop里,大大提高了通量,在建库部分,由于该文章发表于2015年,所以文中提到采用CEL-seq或MARS-seq的较老的建库方法。而CEL-seq2在2016年才出现,通过接头随机引物法将效率从直接连接法的60.9%提高到93.8%。所以今天再去做inDrops方法的时候,建库时就可以直接用带接头的随机引物来引入测序接头。

这里我们来小结一下,首先是基于末端加A/C的原理,以2009年的单细胞方法为基础,2013年的Quartz-seq采用抑制性PCR的策略使引物自杂交形成平底锅结构来降低副产物,2015年的SC3-seq,主打富集3端测序,同年的SUPeR-seq采用半随机引物去反转total RNA,2017年的MATQ -seq结合MALBAC引物和末端加C的思路达到高效合成cDNA,2018年的Quartz-seq2优化了前一代方法,做高通量并最大限度降低成本,同时优化了实验的细节(反应buffer等)。

而对于IVT这一原理,其变化较少,以2012年的CEL-seq为基础,2014年MARS-seq做了在384孔板上结合UMI、Barcode达到高通量,2015年inDrops,使用油包水的原理达到更高的通量,2016年,CEL-seq2对于IVT后的建库方法做了改进。

从历史的发展来看,每一个方法都有所提升的可能,而高通量可以说是最容易想到也最容易做到的改进,就IVT而言,高通量过程经历了从单个tube到96/384孔板再到油包水的发展。之于实验之中的优化思想,就需要大量的广阔的知识积累和运用。相信看了前面的一些方法的变化及优化,对于我们自己的实验设计不一定完全使用某一种方法,而是基于某个原理的最优策略的组合,也就是集各优化之大成来达到高效。就像前面提到的,比如要做IVT原理的高通量单细胞转录组,目前可以用inDrops配合CEL-seq2的建库思路的组合达到更高效。

还是那句话,涉及到的方法比较多,如有纰漏的地方大家及时指出,我们及时修改,大家一起进步!

1. Hedlund E, Deng Q. Single-cell RNA sequencing: Technical advancements and biological applications[J]. Molecular Aspects of Medicine, 2017, 59:36-46.

2. Sasagawa Y , Nikaido I , Hayashi T , et al. Quartz-Seq: A highly reproducible and sensitive single-cell RNA-Seq reveals non-genetic gene expression heterogeneity[J]. Genome biology, 2013, 14(4):R31.

3. Siebert P D , Chenchik A , Kellogg D E , et al. An improved PCR method for walking in uncloned genomic DNA[J]. Nucleic Acids Research, 1995, 23(6):1087-1088.

4. Sasagawa Y , Danno H , Takada H , et al. Quartz-Seq2: a high-throughput single-cell RNA-sequencing method that effectively uses limited sequence reads[J]. Genome Biology, 2018, 19(1):29.

5. Nakamura T , Yabuta Y , Okamoto I , et al. SC3-seq: a method for highly parallel and quantitative measurement of single-cell gene expression.[J]. Nucleic Acids Research, 2015, 43(9):e60-e60.

6. Single-cell RNA-seq transcriptome analysis of linear and circular RNAs in mouse preimplantation embryos[J]. Genome Biology, 2015, 16(1):148.

7. Sheng K, Cao W, Niu Y, et al. Effective detection of variation in single-cell transcriptomes using MATQ-seq[J]. Nature Methods, 2017, 14(3):267.

8. Lazinski D W , Andrew C . Homopolymer tail-mediated ligation PCR: a streamlined and highly efficient method for DNA cloning and library construction[J]. BioTechniques, 2013, 54(1).

9. Hashimshony T , Wagner F , Sher N , et al. CEL-Seq: Single-Cell RNA-Seq by Multiplexed Linear Amplification[J]. Cell Reports, 2012, 2(3):666-673.

10. Tamar H, Naftalie S, Gal A, et al. CEL-Seq2: sensitive highly-multiplexed single-cell RNA-Seq:[J]. Genome Biology, 2016, 17(1):77.

11. Jaitin D A, Kenigsberg E, Kerenshaul H, et al. Massively Parallel Single-Cell RNA-Seq for Marker-Free Decomposition of Tissues into Cell Types[J]. Science, 2014, 343(6172):776-779.

12.Klein A M, Mazutis L, Akartuna I, et al. Droplet barcoding for single cell transcriptomics applied to embryonic stem cells[J]. Cell, 2015, 161(5):1187-1201.

(0)

相关推荐