综述 | Nature子刊:单细胞和单核RNA测序方法的系统比较
编译:艾奥里亚,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
近年来,随着单细胞RNA测序方法的规模和能力迅速扩大,这使得重大发现和大规模细胞测绘工作成为可能。但这些方法还没有得到系统和全面的基准测试。本研究中,基于使用情况以及所涉及准备数据文库的专业程度,作者选取了具有代表性的7种用于单细胞或单核分析的方法:包括2种低通量和5种高通量方法。选取细胞系、外周血单个核细胞和脑组织等3种不同的样本类型,在单独的实验中获得了36个数据文库用于对不同的方法进行比较。为了直接进行比较同时避免不同pipelines带来的处理差异,本研究开发了一种名为scumi的方法,该方法可以灵活的计算pipeline,同时可与任何单细胞RNA测序方法一起使用。本研究中,研究者对这些方法在基本性能(如reads的结构和比对、多倍体的灵敏度和范围)和它们重复样本中已知生物信息的能力两方面进行了评估。
论文ID
原名:Systematic comparison of single-cell and single-nucleus RNA-sequencing methods
译名:单细胞和单核RNA测序方法的系统比较
期刊:Nature Biotechnology
IF:31.864
发表时间:2020年4月6日
通讯作者:Joshua Z. Levin
通讯作者单位:麻省理工学院与哈佛大学旗下博德研究所(Broad Institute of MIT and Harvard)
DOI号:10.1038/s41587-020-0465-8
实验设计
除了特殊情况外,作者对混合细胞系和PBMCs样本进行了两次单细胞测序实验。为了获得Seq-well数据,作者在其他时间对PBMC1进行了第二组实验,该实验与主PBMC1实验中使用的实验完全相同。类似的,作者在不同的时间采用10x Chromium(v2)和10x Chromium(v3)对PBMCs进行了第三次实验。此外,作者用四种方法对小鼠全皮质核进行了两次实验。在所有情况下,每一种实验方法都是由不同的研究人员同时进行的,由于细胞或细胞核等待开始实验的时间,结果将是直接可比的,而不会有任何混淆。
研究内容
1 scRNA-seq方法的比对
作者选择了七种scRNA-seq方法进行比较,同时选取三种不同的样本(小鼠和人混合细胞系、人外周血单核细胞(PBMCs)以及小鼠皮质细胞核)对不同方法进行测试(图1)。鉴于HEK293和NIH3T3细胞都属于常见的细胞样本且每个细胞的RNA含量相对较高,本研究选择用50%的人HEK293细胞和50%的小鼠NIH3T3细胞制备混合细胞系。此外,作为不同种类细胞的混合物,PBMCs的细胞类型和相关的表达模式得到了很好的研究,因此作者选择PBMCs作为第二种样本进行研究(由于作者所检测到的基因数目较低,因此作者并未采用该样本对sci-RNA-seq方法进行测试)。由于这些样品具有不同的性质,因此作者将单个细胞的研究扩展到单核研究。脑组织作为组织类型中主要的样本,且通常通过单核RNA-seq进行分析,因此基于以前被应用于单核研究的四种方法,作者对小鼠皮质进行了分析。在每个实验中,在低通量方法中意在收集约384个细胞;在高通量方法中意在收集约3000个细胞,同时采用bulk RNA-seq文库作为对照。
2 scumi计算流程允许对任何scRNA-seq方法进行统一分析
由于每种方法都有自己的标准计算流程,作者开发并使用了一个“普适性”的方法以便直接比较所有的实验方法,并消除现有技术流程引入所带来的处理差异。首先,开发了scumi软件包,该软件包以FASTQ文件作为输入,生成用于下游分析的基因×细胞表达计数矩阵。其次,解决了在下游分析之前过滤掉低质量细胞的主要预处理挑战(这使得作者可以公平客观的对所有方法进行评价)。当所选择的细胞barcodes具有很大数量的reads或被分配到很大数量的单分子标签(UMI)时,选择哪个阈值来排除可能反映环境RNA而非真实细胞/细胞核的低质量细胞或barcodes是具有挑战性的。在混合实验中,作者去除了低数量的UMI或细胞reads。对于由不同特征不同细胞组成的更复杂的PBMCs和皮质样本来说,这种简单的方法可能不利于具有相对较少RNA的细胞类型的重复。相反,作者首先对大量的细胞barcodes进行初步观察并进行了初步的聚类,鉴定出差异表达的基因,以找到聚类的特异性标记基因,并在可能是低质量的簇中去除细胞。
第三,在计算可能显示具有更大测序深度的改进的度量之前,在给定的实验中,作者对所有相同类型的方法(无论是低通量还是高通量)都进行了相同reads深度下的抽样。这使得作者对不同方法的比较更具有可比性。但值得注意的是,由于在大多数实验中,作者对除Smart-seq2之外的所有方法中遵循细胞barcode和UMI序列的Poly(T)序列进行了测序,但由于缺乏预期read结构的reads不太可能为进一步分析提供信息,因此作者追踪并删除了预期位置上没有Poly(T)结构的read。
最后,通过以下几个关键指标对所有的方法进行评估:(1)对于核基因和线粒体基因组的reads的结构和排列;(2)捕获RNA分子的敏感性;(3)多重态的程度(在混合实验中评估);(4)它们在表达评估方面的技术精度/可重复性;(5)恢复细胞类型中有意义的生物学差异的能力(对于PBMC和皮质实验)。
3 read的结构和对齐显示了方法之间的效率差异
首先,对每个文库中的reads在其结构和与基因组一致性方面进行了表征。这些指标可以更有效的为下游分析生成有用reads的。在混合实验中,作者只考虑唯一映射的reads,以尽量减少多映射reads对计算细胞多重态速率和其他度量的影响。但这种方法对于那些在预期位置不带poly(T)的reads存在差异。随后的研究中,作者考虑了这些reads在不同类别中分布:外显子、内含子、基因间隔区、不同基因的重叠、多映射和未映射。在混合实验中,Smart-seq2和inDrops的一个重复的外显子reads最高(分别为51.0%、53.7%和56.9%),而sci-RNA-seq的两个重复样本的性能最差(28.7%和29.4%)。总体而言,与混合细胞系样本相比,PBMC样本中与外显子一致的reads的比例更低,inDrops的一个重复具有最高的外显子reads比例(46%),而Seq-Well具有最低的外显子reads比例(20%)。为了探索未映射reads的起源,进一步对PBMC数据集进行了分析,在文库构建或是Poly(A)延伸的过程中对齐添加的适配器序列,发现这些reads的质量通常都很低。利用Trimomatic从未映射的reads中去除低质量和适配序列,除了inDrops PBMC1和SeqWell PBMC2之外,研究者在每种情况下最大恢复了5%的未映射reads,但对上述两种情况来说,作者分别恢复了约8%和约18%的初始未映射reads。
虽然每种方法在皮质细胞核和其他实验中的相对性能大致相似,由于细胞核中包含的未剪接转录本的比例高于整个细胞,细胞核中的内含子reads与外显子reads的比率高于细胞。
4 方法灵敏度在实验中的相对排序相似
由于scRNA-seq方法从有限的RNA输入开始,因此敏感性(即捕获RNA分子的能力)是其关键的质量指标。在相同的数据深度下,作者通过测量数据集中每个细胞检测到的UMI或基因的数量来评估每种方法的灵敏度。唯一的例外是Seq-Well PBMC1,每个细胞中约有46000个reads,而对PBMC1样本的其他高通量方法来说,每个细胞约有69000个reads。对于混合细胞系实验,由于小鼠和人类细胞类型中UMIs和每个细胞中基因的数量不同,作者分别列出了这两种细胞的结果,因此不同文库中人和鼠细胞比例的差异可能会出现偏差,但人类和小鼠细胞的总体排名是相同的。总的来说,低通量方法Smart-seq2和CEL-Seq2的灵敏度最高,而在高通量方法中,10x Chromium检测到每个细胞中的UMIs和基因数量最多。在混合实验中,inDrops所表现出的灵敏度最低;与10x Chromium(v2)和sci-RNA-seq方法相比,Seq-Well在每个细胞中所检测出的基因数量较少,但却多于Drop-seq和inDrops两种方法。当比较每个细胞检测的UMI的中位数(图2a)、每个细胞检测的基因(图2b)或每个细胞的平均检测reads时,这些方法的相对排序相对一致的。同样,在PBMCs样本中,相对于高通量方法来说,低通量方法在每个细胞中检测到更多的UMIs和基因数量(图3)。在所有的高通量方法中,10x Chromium(v3)方法在每个细胞中检测到的UMIs(4494)和基因(1482)数量的中位数最高(图3)。而inDrops和Seq-Well两种方法的中位数最低(图3)。在皮质细胞核中,Smartseq2是唯一的低通量方法,该方法的测序深度略高于其他样品。与高通量方法相比,Smart-seq2方法在每个细胞中检测到更多的UMIs和基因数量(图4)。在所有的高通量方法中,10x Chromium (v2)这种方法在每个细胞中所检测到的UMIs(5126和3127)和基因(2462和1744)的中位数最高(图4)。
为了探索灵敏度如何随测序深度的变化而变化,以PBMCs数据集作为研究对象,在每种方法中减少了reads的采集量。对于每个数据集来说,在测试的所有测序深度中,在每个细胞中检测到的UMIs或是基因数量方面,不同方法的相对排序保持一致。虽然低水平的其他细胞所检测到的reads的增加可能会混淆这些分析,但除了 Seq-Well PBMC2之外,其他方法检测到的基因数量在这些测序深度可能没有饱和。
5 混合实验可以检测多个细胞并从其他细胞读取
由于混合实验始于人和老鼠细胞的混合,因此在混合实验中,作者能够评估multiplet rates的分布。除了inDrops实验外,所有七种测试方法的观察到的multiplet rates均小于3.5%。multiplet rates决于每个实验中使用的细胞数和小鼠与人细胞的比率,但作者不可能以不同方法使用相同的细胞数或相同的细胞比率来进行排序。低通量的multiplet rates最低(<1%),这与预期的结果相一致。
研究者同样探究了multiplet rates是如何随每个细胞检测到UMIs数量的变化而变化的。正如预期的那样,多个RNA的存在代表着将有更多的RNA输入,因此在UMIs数量最多的细胞中,multiplet rates较高(图2c)。虽然大多数具有中间量UMIs的细胞不是multiplets,但在某些情况下,UMIs数量最低的细胞具有更高的速率,这表明这些细胞可能是低质量的,或者贡献来自无细胞的环境RNA(图2c)。在sci-RNA-seq的第二次实验中,由于未知的原因,multiplet rates比其他方法下降得更快(图2c)。
作者还利用混合实验来探究细胞中检测到的基因是否实际上来自该细胞,而不是来自其他细胞的“污染”。随着测序深度的增加,从“错误”物种中检测到更多的基因,正如回归线沿每个轴相邻的细胞barcodes的斜率所反映的那样,这代表着斜率越低性能会越好。在低通量方法中,Smart-seq2要优于 CEL-Seq2;而在高通量方法中,inDrops的斜率最低,而Seq-Well的斜率最高。
6 基因表达定量方面技术的精确度、重复性和准确性
除了上述研究外,作者还比较了scRNA-seq数据中的变异度,以评估混合实验中(由两个在可控条件下生长的同性质的细胞系组成)不同方法的精确度。尽管在细胞培养中可能仍然存在一些细胞间的异质性,但作者猜想,技术变异是这种情况下的主要驱动力。以前的研究表明,这种技术变异一般服从泊松分布。Cel-Seq2、InDrops和Drop-Seq具有相对较低的额外泊松变异系数。与以前的发现一致,由于并未使用UMIs,这使得Smart-seq数据集具有最高的额外泊松变异系数。除此之外,作者还比较了在不同重复之间的重复性以及利用bulk和pseudo-bulk数据集对准确性进行了研究。
7 方法不同,它们区分和恢复细胞类型的能力不同
由于scRNA-seq方法具有揭示潜在生物学的能力,因此我们选择该方法进行研究。在有关scRNA-seq生物学特征的研究中,聚类scRNA-seq图谱是用来区分不同的细胞类型最突出的方式。PBMC和小鼠皮质数据集都由不同的细胞类型组成,因此作者选在这两种数据集对不同方法进行比较。为了使每种方法都能够进行公平和最优的评估,在每个实验中,作者不仅对低通量和高通量方法的每个细胞的读取次数进行了相同深度的采样,同时作者还在相同深度下进行了额外一轮的采样。但由于Seq-well PBMC2实验中,作者只使用了一个microwell array,这使得在该实验中的细胞较少;而在Seq-Well PBMC1和DroNc-seq Cortex2实验中使用了双矩阵,但由于未知的原因,这两个实验中的细胞也较少。
对于每个数据集,作者根据它们的基因表达谱对细胞或细胞核进行聚类,以评估它们如何检测到已知的细胞类型及其相关的转录谱。对于每个数据集,作者搜索了一系列参数,以选择最佳聚类来恢复每个预期的细胞类型。根据已知的标记基因为每个簇分配了一个细胞类型标识。作者采用计算接收器操作特性曲线(AUC)下的面积的方法,对分离的细胞类型进行量化分析。对于PBMCs,不同的方法在区分细胞类型、恢复的细胞类型的比例以及在某些情况下完全恢复某些细胞类型的比例方面的能力有所不同。和预期一样,不同方法在区分转录相关细胞类型具有一定的困难,如CD4+ T细胞、CD8+ 细胞毒性T细胞和自然杀伤细胞(图5)。从PBMC2的t-SNE(t-distributed stochastic neighbor embedding)图中,作者观察到10x Chromium和inDrops两种方法表现良好(图5a)。由于不同实验的所有文库都是从相同的样本中生成,所以作者评估了不同方法分配给每种细胞类型的细胞比例的一致性(图5b)。一般情况下,大多数方法成功地恢复了PBMCs中丰富的细胞类型,但相对丰度有所不同。对于低通量方法,由于没有足够数量的细胞,因此在低通量的方法中作者并未探究稀有的细胞类型(图5b)以及他们对AUC的测量结果的相似度(图5c)。在PBMC1样本中,在高通量方法中,10x Chromium(V2)在所识别的细胞类型的数量和跨细胞类型的平均AUC方面都显示出最好的质量,其次是Drop-seq和10x Chromium (v3),Seq-Well和inDrops两种方法不能识别两种细胞类型(图5c)。在PBMC2样本中,10x Chromium (V2)和 inDrops表现良好,识别了所有细胞类型(图5c)。
与PBMCs样本的结果相似,小鼠皮质具有明确的细胞类型,包括兴奋性和抑制性神经元、astrocytes、 少突胶质细胞(oligodendrocytes)、少突胶质细胞祖细胞(oligodendrocyte progenitor cells)、小神经胶质细胞(microglia)、内皮细胞(endothelial cells)和周细胞(pericytes)。在所有的方法中,除了sci-RNA-seq方法之外,作者还鉴定出除了周质细胞之外的所有上述细胞类型,周质细胞作为一种罕见的细胞类型,仅在DroNc-seq Cortex1中被检测到(图6)。在sci-RNA-seq方法所得数据库中,作者同样没有检测到少突胶质细胞祖细胞和小神经胶质细胞(图6)。在AUC分析中,虽然不同方法检测预期细胞的相对能力因细胞类型而异,但Smart-seq2,10x Chromium(v2)以及DroNc-seq具有较大的面积(图6c)。其中,尽管Smart-seq2数据集中的细胞较少,但仍能检测到上述细胞类型。
图6 皮质细胞核的细胞类型识别和分配。a代表基于细胞类型着色的Cortex1文库的单细胞剖面(点)的t-SNE图;b代表用不同方法(x轴)检测每种细胞类型(y轴)的细胞比例;c代表从分类细胞类型到分配给Cortex1和Cortex2的每个聚类的AUC。
8 不同方法的综合数据分析增强了生物信号和一致性
有些方法有时可能检测不到某些细胞类型,其原因可以归因于以下两点:(1)由于实验问题,数据库中并未包含这些细胞类型的cDNA;(2)考虑到测序的深度和细胞的数量,有些细胞的数据质量可能不足以识别它们。我们利用Harmony整合了PBMC样本的所有试验数据以区分上述的可能性。其中,我们在每个单独的数据库中检测到了所有的细胞类型,因此作者的结果支持了第二种可能性并显示跨方法累积数据的能力。虽然大多数合并的和单独的细胞类型分配是一致的,但有些细胞类型似乎更难区分。总的来说,10x Chromium(v2)是整合分析和独立水平聚类之间最一致的,其次是10x Chromium(v3),而其他在具有相对较高的一致性的同时,也存在一些波动。
9 scumi与标准计算管道的比较
虽然在本研究中使用了scumi计算管道以尽可能相似的方式分析每种方法的数据集,但作者还将每个数据集与其原始的特定方法管道进行了比较,并发现了大致相似的结果。
讨论
本研究系统地对三个主要类别样本的七种方法进行了比较,并总结了它们的相对优点。作者的结果在灵敏度(图2-4)、重复性、技术精确度和捕获关于细胞类型的生物学信息(图5-6)的方法的排名上大体上是一致的。但本研究中的一个局限是作者所选取的样本不适合进行伪时间分析。所有的方法都能够生成有用的数据,但总的来说,作者发现10x Chromium具有最强的一致性性能。在有限的10x Chromium (v3)测试中,虽然其表现出更高的灵敏度(图3),但作者没有检测到其对细胞类型识别的改善(图 5),同时发现其表现出更高比例的与线粒体基因一致的reads。具有衡量更多单细胞数量能力的sci-RNA-seq方法,在处理某些样本时(PBMCs)可能是最优选择。但其在小鼠皮质细胞核中的表现并不理想,在分析小鼠皮质细胞时,该方法无法识别一些细胞的身份,同时也无法检测到已存在的所有细胞类型(图6)。对于低通量方法而言,Smart-seq2和CEL-seq2的性能相似,无法评价哪个更好(图2-5)。对于需要最高灵敏度的研究来说,正如之前所表述的,这两种方法明显优于高通量方法(图2-4)。Smart-seq2在基因变异检测和RNA剪接异构体研究中具有先天的优势。对于CEL-seq2来说,基于在从不同细胞汇集cDNA之后会存在这样一个过程,在该过程中,来自一个细胞的细胞barcodes与来自不同细胞的barcodes存在相互交换的可能,因此不能排除来自其他细胞污染所产生的reads的问题。
除了性能之外,在本研究中作者还对每种方法所消耗的时间和试剂成本进行了比对。Drop-seq、Seq-Well和inDrops的成本最低,Smart-Seq2最贵。包括sci-RNA-seq在内的许多方法,对于数量更多的单细胞或细胞核来说会更具成本效益。在实践中方面,10x Chromium所需时间最少,Smart-seq2、CEL-seq2和inDrops所需时间最长。作者没有使用自动化,但它可以减少实际操作时间并对成本造成影响。
分析单个细胞核而不是单个细胞是一种十分重要的策略,该方法很好的解决了不容易解离成单细胞悬液(如脑、骨骼肌或脂肪)和冷冻样品的组织样本,并尽量减少解离过程中可能导致的基因表达的改变。与之前的研究相一致,本研究发现单核RNA-seq在敏感性(图4)和细胞类型分类(图6)方面的性能表现良好。
本研究,包括scumi pipeline,以及相关数据和方法,在未来可作为一种在许多应用scrna-seq方法的领域研究的资源,并提供重要的指导。首先,在跨越三种样本类型中使用一组连贯且可重复收集的数据集对关键方法提供直接指导。作者选择了两种非常不同的组织类型,使框架和结论更具可推广性,并通过对其他三种组织的已发表数据集的分析来证明这一点。本研究将为未来在测试新组织样本时,减少操作样本数量提供了数据支撑。第二,本文给出的每种方法的结果可用于进一步优化和改进现有的scRNA-seq方法。第三,作者使用具有代表性和易于获取的样本类型应该允许未来的研究,特别是那些引入新的或改进的方法的研究。最后,预计数据集将对计算方法开发人员在算法的基准测试方面并为HCA、大脑倡议(Brain Initiative)和其他绘制疾病细胞图谱的努力等工作提供有价值的帮助。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响