综述 | 英国惠康-桑格研究所Lia Chappell & Andrew J.C. Russell等:单细胞(多)组学技术
近年来以核酸、蛋白质、代谢物及其之间相互作用网络为主要研究对象的多组学研究已经延伸到了单细胞水平。单细胞多组学技术是指对同一单个细胞进行多层次的组学测序,与分散细胞的传统测序相比,单细胞多组学技术可以提供更深入的生物学见解。单细胞多组学技术可以在多个层面上揭示细胞群体内的细胞异质性,并揭示其如何在不同组学层次上相互关联或变异。这些技术可以使人们对驱动细胞异质性的关键生物学过程和机制及其与发育、衰老以及疾病病因学之间的联系有更深入的了解。这篇综述详述了单细胞单一组学和多组学技术及其局限性、应用和未来发展趋势。
论文ID
译名:单细胞(多)组学技术
期刊:Annual Review of Genomics and Human Genetics
IF:7.914(二区)
发表时间:2018年
通讯作者:Lia Chappell & Andrew J.C. Russell
通讯作者单位:英国惠康-桑格研究所
DOI号:10.1146/annurev-genom-091416-035324
简介
细胞的状态主要由其基因组、表观基因组、转录组和蛋白质组之间的相互作用来定义。由于分离单细胞和单细胞中的微量分析技术的发展,可以在单细胞的层次上分析以上这些不同层次的“组学”,这使研究人员能够探索同种细胞间的的异质性,即使在有丝分裂期间从同一前体细胞刚刚分裂得到的两个子细胞也可能在其基因组,转录组和蛋白质组中表现出差异。
不同组学都存在多种可以用于分析单细胞方法,但在灵敏度、特异性、适用性方面有所不同。研究人员应该对所用方法的局限性及其对结果的潜在影响等方面有一定了解。由于单细胞技术发展迅速,本综述中描述的许多研究代表了当前研究前沿,其中一些操作方法已经较为成熟(例如单细胞RNA测序),而另外一些方法较新,使用的较少。
在组学技术基础上发展而来的单细胞多组学技术,能够在同一细胞中整合多个组学分析,包括基因组学与转录组学、表观基因组学与转录组学、转录组学与靶向蛋白质组学等,获得更多、更完整的信息,从而更好地反映了实现细胞功能的复杂交互网络。此外,对单个细胞的多个组学数据差异的关联分析,可以明确识别其关系,不会受到体细胞遗传变异以及细胞状态和外部环境的变化的影响。另一个优势是单细胞多组学技术能够研究组织的发育史并解析决定细胞表型的调控机制。细胞DNA准确的记录了从受精卵开始每个细胞周期所发生的突变,可以揭示细胞的谱系及与其共同家系的细胞群的关系。将细胞谱系树与转录组整合可以揭示健康和患病器官内特定细胞类型和状态的发育历史。进一步与表观基因组学联合将可以推断出细胞调控及分化的关键机制。总之,使用单细胞多组学技术的整合能力将使人们对细胞和组织的认识达到前所未有的程度。
同时,非组学的信息也是全面了解细胞异质性的重要信息。例如,由于人体器官功能是在特定空间中通过单个细胞的协同作用来执行的,因此在特定空间中研究单个细胞至关重要。这不仅对于了解正常器官的发育和功能很重要,而且对于研究细胞(亚群)在包括癌症和神经系统疾病在内的疾病条件下如何受到干扰也很重要。因此,介于空间信息有助于对组织内的细胞有完整的了解,有必要建议将其作为组学分析的一个附加的层面。
在本文中,作者概述了单细胞组学和多组学方法,包括了各种最近开发的新技术。主要关注技术原理及其优势和局限性,并考虑将多组学方法应用于生物学问题。最后,回顾了可能的未来发展以及多组学技术的应用。
细胞分离与标记
细胞分离和细胞标记:单细胞组学和多组学技术的关键
单细胞组学技术的关键是分离获得单个细胞用于之后的组学分析。细胞分离技术各优缺点,其中低通量方法例如手动显微操作、激光捕获显微切割术、拉曼镊子和膜片钳,用于捕获特定细胞并可以保留各细胞的空间信息。然而这些方法费力且每次只能分离数十或数百个细胞。
荧光激活细胞分选术(FACS)可以获得较高的通量,一次通过将单个细胞分选到孔板中获得数千个单细胞,处理量大,但当组织被制成细胞悬液时,各个细胞的空间信息会造成丢失。
微流控芯片可以通过控制控制流体一次处理上万个单细胞,流体量降至nL或pL的体积,样品用量少成本低。但是细胞悬液的的制备也会丢失空间信息,而且与FACS相比细胞表型信息例如细胞表面蛋白等也丢失了,新方法中允许使用替代技术来捕获表型信息。
细胞条形码(给每个细胞加上独一无二的DNA序列用于识别,就是条形码barcode)也是至关重要的步骤,这样可以将来自多个单个细胞的文库一起测序,而下游生物信息学步骤能够将序列数据反卷积为代表每个细胞的文件。多数情况下细胞条形码是在测序之前在最后的PCR步骤中添加的,而应用微流体技术可以在操作开始时添加细胞条形码。基于组合索引策略对孔板中的细胞分别进行FACS分选,用独特的条形码标记,然后将所有孔中的细胞汇集起来重新分类,重复多次分类和汇聚,可以使每个细胞具有唯一的条形码。但是使用组合索引策略会丢失许多细胞,例如6个96孔板中大约150000个秀丽隐杆线虫幼虫经处理产生了42035条秀丽隐杆线虫单细胞转录组。
单细胞组学技术
单细胞单组学技术
要了解如何将单细胞单组学方法结合到当前和将来的多组学技术中,重要的是要了解关键的方法步骤及其各自的优势和局限性。作者简要介绍了单细胞单组学技术的广泛使用和最新技术。
基因组测序
细胞分裂中基因组碱基突变造成遗传异质性,从而导致多细胞生物组织内的体细胞遗传变异。这种遗传异质性可导致多种癌症、神经疾病和发育性疾病等多种疾病,大量研究报道了体细胞遗传变异导致表型变化、衰老和疾病的发生。但是在技术和经济上限制了单细胞DNA的研究。人类二倍体细胞包含大约7 pg的基因组DNA(gDNA),必须进行全基因组扩增(WGA)才能产生足够的DNA进行测序。目前WGA主要是通过 PCR、多重替换扩增技术(MDA)或两者的组合来实现,但所有WGA方法都容易出现由于聚合酶的错误扩增等问题导致的假阳性。因此WGA方法更适合发现DNA拷贝数。
应对这些问题的新方法正在兴起,包括优化WGA条件,保证一致性以及直接制备单细胞测序文库。通过改变多排量扩增条件以及对等位基因扩增偏向进行计算建模,实现了灵敏度90.1%、假阳性0.12/每百万碱基对。一种通过转座子插入进行线性扩增的方法(LIANTI),减少了常规WGA方法中的扩增偏差和错误,可以获得97%的基因组覆盖率及5.4×10-6的假阳性率,可以用于检测单核苷酸突变。此外,微流体反应器法法单链测序(SISSOR)对单细胞基因组进行测序错误率低至10-8,但基因组覆盖率降低(63.8%±9.8%)。还可以通过使用片段化、衔接子标记和随后的PCR直接从单细胞裂解物制备测序文库。以上方法适合gDNA拷贝数分析,但还不适合进行完整的基因组搜寻识别。
全基因组甲基化测序
DNA甲基化主要形成5-甲基胞嘧啶(5-mC),是一种表观遗传标记,之前一直认为与转录抑制相关,但该标记可能对转录具有不同的特定效应。甲基化具有多种检测方法,大多数方法基于亚硫酸氢盐亚硫酸氢盐将胞嘧啶转化为尿嘧啶,但不能催化甲基化的胞嘧啶,测序后区分甲基化与未甲基化的胞嘧啶可以确定甲基化位点。但是,单细胞甲基化测序不仅DNA起始材料受到限制,而且亚硫酸氢盐处理还会造成广泛的DNA损伤,从而造成更高的基因座和等位基因缺失率。此外,在亚硫酸氢盐处理过程中可能会发生过度转化(导致假阴性CpG)和转化不足(导致假阳性CpG),需要将具有过高或过低的转化率的排除,一般选取阈值为1%到5%之间。二倍体小鼠细胞基因组中约有2190万个CpGs,利用单细胞限制性代表区域甲基化测序(scRRBS)单个样本可平均覆盖约100万个CpG,汇总后最多可覆盖约150万个CpGs。
而对转化率低于2%的样品,可以分离单细胞后利用限制性内切酶MspⅠ消化DNA,由于酶切位点如果甲基化则不能被被酶切,而CpG在整个基因组中分布不均且倾向于聚集在靠近基因启动子区域的CpG岛上,因此MspⅠ消化会导致富集CpG片段,之后再测序对富集片段的甲基化开展分析。而亚硫酸氢盐诱导的DNA损伤可以通过单细胞亚硫酸盐测序技术(scBS-seq)解决。该技术直接将第一步扩增的小片段加上生物素标记的随机引物用于测序,保证了各种长度的转化片段都能进入文库用于测序。该技术用于分析小鼠基因组,可以提供最多1010万个CpG位点的甲基化状态信息,从而对标准二倍体小鼠细胞的平均370万个CpGs进行了分析。这项技术也可以用于转化率低的样本检测。
单细胞全基因组甲基化测序(scWGBS)是利用亚硫酸氢盐,然后使用含有接头的序列扩增5个循环,在引入另外一端的接头后进行 PCR 扩增。在二倍体小鼠细胞中平均覆盖100万个CpGs,最多覆盖270万个CpGs,其检测率更高且实用性更强。该方法也已在单细胞测序中使用,scWGBS可减少扩增偏差,从而更准确地鉴定PCR重复片段并降低试剂成本。与scWGBS相比,scBS-seq具有更高的库复杂性,因此更适合于高覆盖率下的深度测序。scWGBS更适合于低覆盖率甲基化分析。
单细胞测序中最好的方法是使用甲基化敏感的限制性内切酶,可避免亚硫酸氢盐介导的DNA降解。最初使用的是BstUI,识别CG∧CG位点,甲基化后的位点不能识别消化,可以分析6个基因座。单细胞甲基化限制酶切分析(SCRAM)提高了该技术的通量,可分析48个单细胞中的多达24个基因座。除此之外还有HpaⅡ识别5-CC∧GG-3。但这些方法都不能全基因组范围分析。
DNA的甲基化收到复杂的调控,Tet蛋白将5mC去甲基化,并进一步氧化为5-羟甲基胞嘧啶(5hmC),5-甲酰基胞嘧啶(5fC)和5-羧胞嘧啶(5caC),可以用来追踪DNA甲基化的动力学。此外,有证据表明5fC和5caC可以通过影响RNA聚合酶Ⅱ的速率和特异性来影响转录。因此需要新的方法研究这些修饰的位点。甲基化酶辅助亚硫酸氢盐测序法(MAB-seq)可以间接检测5fC和5caC,也适用于单细胞,被用于分析小鼠胚胎干细胞和卵裂球的细胞特异性5fC / 5caC谱及定位姐妹染色单体交换。此外,单细胞单碱基分辨率的5fC测序技术(scCLEVER-seq)可以直接检测5fC,5hmC也有对应的内切酶体系。
组蛋白修饰
N / C末端的组蛋白的修饰可改变DNA基因座附近基因的表达。在单细胞水平上分析组蛋白修饰有助于研究细胞的表观遗传过程(例如细胞分化轨迹)并预测可能的转录状态。
基于液滴的染色质免疫沉淀(Drop-ChIP)以单细胞分辨率检测组蛋白的修饰。大量样品的ChIP是利用特异性的抗体拉下与组氨酸结合的染色质,然后再测序(ChIPseq)。而单细胞含有的目标抗原决定簇少,非特异性结合会导致信噪比低。 Drop-ChIP使用微流体装置捕获含有裂解剂和微球菌核酸酶(MNase)的单细胞溶液,然后加入细胞特异性条形码和DNAligase,用来产生特异的染色质片段,再进行ChIP-seq。此方法用于鉴定小鼠细胞混合群体中分组蛋白第三亚基四号赖氨酸的二甲基化(H3K4me2)和三甲基化(H3K4me3),每个细胞能捕获到约1000个reads,产生约800个DNA片段。尽管灵敏度降低,但数据准确性很高,约有50%的reads符合已知大量样品的ChIP-seq结果对应。
开放性染色质测序
对开放的染色质或可及性DNA的分析可以用于推断基因调控元件作为启动子和增强子的用途并挖掘转录因子。对于大量样品开放性染色质分析的方法有MNase测序(MNase-seq)、甲醛辅助分离调控元件技术(FAIREseq)和DNase测序(DNase-seq),都是通过对可片段化的接近性DNA(<200个碱基对)建库测序。单细胞的DNase-seq 可以通过在纯化和文库制备过程中环状载体DNA来实现。
利用转座酶探究可接近性染色质测序技术(ATAC-seq)通过转座酶结合开放染色质DNA并同时将其片段化,然后对酶捕获到的DNA序列进行测序。通过微流体平台ATAC-seq可以用于单细胞测序,可处理多达96个样品。单细胞ATAC-seq也已使用组合标记法实现,但这需要携带条形码的转座酶,目前尚无商业途径。
核结构
基因转录还受到细胞内DNA的高级染色质结构调节。单细胞高通量染色体构象捕获技术(scHi-C)可用于确定单细胞内的染色体结构,揭示不同基因座位上之间的空间交互信息,还用于将拓扑动力学与细胞周期进程相关联。通过单细胞组合标记的Hi-C(sciHi-C)等方法可以提高其灵敏度。scHi-C的关键步骤是细胞核悬浮液中大量细胞样品的交联,利用限制性内切酶消化使gDNA片段化后生物素标记突出末端,最后使相连的片段重新连接从而能获得核的空间定位信息。随后分离单个细胞核,解除交联并捕获生物素标记的片段,并将其转换为测序文库。下游分析通过分析同一片段中存在哪些远距离的序列,从而获得基因组的空间关系。
DNA腺嘌呤甲基转移酶鉴定(DamID)是单细胞DNA-蛋白质相互作用的鉴定方法,是利用E. coli的腺嘌呤甲基转移酶(Dam)与需要检测的目标蛋白融合,通过目标蛋白与其互作的DNA的结合,导致融合的Dam接近并催化互作的DNA序列中GATC基序中的腺嘌呤甲基化,甲基化的序列特异的限制酶DpnI消化制备文库测序。
转录组
单细胞转录组可以定义细胞类型和细胞状态,解析细胞内基因的共表达和排他性表达。许多转录本的表达水平较低,每个细胞仅5–20个转录本。一个典型的人类细胞含有少于1 pg的mRNA。真核生物多聚腺苷酸mRNA的方法是sc RNA-seq技术中最成熟的,但灵敏度和准确性各不相同。通过加入合成已知浓度的外源RNA分子(spike-in),例如ERCC,可以比较这些技术。其很大程度上取决于测序深度,观察到的最大灵敏度为每个细胞约450万个reads。与大量rRNA相比,可以通过使用寡聚(dT)引物选择性扩增真核mRNA。很多方法中使用的是Moloney murine leukemia virus(MMLV)逆转录酶,其他方法还可以将T7启动子整合入cDNA一端的进行体外转录,从而实现线性扩增。
规模是scRNA-seq实验中的关键变量,近年来检测细胞数量呈指数增长。基于孔板的技术一次处理几百个单细胞,可以多次处理数千个细胞。常用技术包括利用逆转录酶的模板转换活性的Smart-seq和Smart-seq2、基于采用线性扩增的CEL-seq和CEL-seq2,以及大规模平行RNA单细胞测序MARS-seq等。最近还有通过使用条形码标记的SCRB-seq及优化有的mcSCRB- seq等各种方法。
而基于微流体的方法则可以一次处理数千个单细胞。基于液滴的平台(如Drop-seq和InDrop)是快速低成本分析大量单细胞。液滴scRNA-seq也已经以相似的规模商业化。基于纳米孔的方法(Seq-well)成本低,而且每个阵列最多可处理10000个细胞。组合索引也可以并行处理数千个细胞,但是需要对细胞进行固定。
其他研究包括:单细胞整合核RNA和细胞质RNA测序(SINC-seq)可以分别测定同一细胞的细胞核和细胞质mRNA。在单细胞水平上非编码RNA技术尚不成熟,但已有单细胞小RNA测序相关技术。
蛋白质组
蛋白质直接介导细胞功能,但单细胞蛋白质组的分析受到原始材料少以及无法直接扩增蛋白质的限制。一个简单的单细胞蛋白质组学使用偶联了荧光基团的特异性抗体,使用流式细胞术测量每个细胞的荧光信号水平,以替代每个细胞的蛋白质丰度。不同蛋白的抗体使用不同的荧光可以分析数十种蛋白质,但荧光吸收波长的重叠限制了蛋白检测种类。用不同的稳定金属同位素标记替换荧光基团可以分析40种以上的蛋白质,但同样受到稳定金属同位素数目的限制。
另一种方法是使用与DNA条码序列连接的抗体,从而将蛋白质信号转换为可扩增的DNA序列。通过扩增抗体-寡核苷酸增加其信号强度,然后检测qPCR或DNA产物测序就可以表示蛋白质水平。其检测容量大但仍然不能覆盖整个蛋白质组,因为缺乏抗体。
Ullal等将DNA标签用一段可被光裂解的小分子连接片段连接到抗体分子上,使用一组约90种条形码抗体对细胞内和细胞外蛋白质进行分析,杂交后将DNA条形码通过紫外线从抗体上解离下来并计数,就可以进行多重定量。该技术的局限性在于不能对样本/细胞多路复用。Abseq通过微流控设备克服了这种多路传输限制。技术使用的抗体连接的DNA条形码包含:抗体特异性序列用于标记靶蛋白,以及含有独特分子指数(UMI)序列用于PCR扩增鉴定序列,从而提高了定量的准确性。微流体装置分离结合以上抗体的单细胞,释放标签后加入含有细胞特异性条形码的寡核苷酸。链重叠延伸PCR(SOE-PCR)用于将细胞特异性条形码与同一液滴内的抗体条形码相关联。可以在一小时内并行分析10,000多个细胞,但是该技术目前仅限于分析细胞表面蛋白。
质谱分析单细胞蛋白质组学(SCoPE-MS)增加了测序深度,在单细胞水平上定量了583种蛋白质。SCoPE利用串联质谱标签(TMT)标记裂解的肽段,将100-200个标记的细胞裂解液合并进行LC-MS/MS检测,通过对TMT标记的肽段进行定量,同时通过合并肽段来鉴定其序列。该技术依靠质谱灵敏度和速度的提高,同时可以扩展到包括蛋白质修饰测序等其他单细胞测序中。
对于分泌或细胞膜表面的蛋白质,可以利用将细胞捕获在nL级的腔室,将微型抗体微阵列置于孔的顶部,可使分泌的蛋白质与其对应抗体结合。通过多色免疫测定法定量分析分泌蛋白质水平可以做到42种蛋白质的分泌蛋白质组。
空间转录组
每个细胞都会在某种程度上整合环境信号,包括与其他细胞和信号分子的相互作用。因此,在主要组织或类器官模型中识别细胞的背景与其三维空间坐标相关至关重要。识别定位的间接方法是通过原位杂交等方法将scRNA-seq信息整合。一种直接的方法是空间转录组学,使用固定排列在载玻片上的条形码化寡聚(dT)引物,引物包含切割位点、扩增柄、空间条形码(ID)、UMI和寡聚(dT)序列。将组织切片放在载玻片上固定,然后透化使游离的的转录本与条形码的寡聚(dT)阵列退火生成cDNA,将其从载玻片上切割下来并转化为RNA-seq文库。目前该技术缺点是阵列上的单个点直径为100μm,因此经常捕获到多个细胞而不是单个细胞的转录本。原位测序方法则是在固定细胞或组织切片中直接制备大规模平行测序文库并进行原位测序,通过位置直接获得空间信息。或者,使用序贯荧光原位杂交技术(seqFISH)可以进行高精度定量检测。seq FISH方法通常比scRNA-seq更为敏感,scRNA-seq可检测细胞中20-40%的mRNA,而seqFISH方法可原位检测85%。空间信息也可以与质谱分析蛋白质组学相结合,用于分析蛋白质组和蛋白质修饰组。
表1 | 单细胞多组学技术
单细胞多组学技术
单细胞多组学技术
细胞裂解后可实现单细胞多组学研究(图1,表1),细胞裂解液可以分开分别进行组学分析,或者不需要事前分离就进行处理或标记。
单细胞基因组+转录组
描绘来自同一单个细胞的DNA和RNA可以明确地将获得的遗传变异与转录变异联系起来。此外,基因组信息可用于构建细胞系进化树,这对于理解正常发育以及疾病病因和进展非常重要。目前有三种方法可以从同一单个细胞中分析DNA和RNA。第一种方法是DNA-RNA测序(DR-seq),在将反应分为两部分之前分别同时预扩增gDNA和mRNA,以便分别获得gDNA和mRNA测序文库。对于gDNA使用多次退火环状循环扩增技术(MALBAC),而mRNA 使用改良的CEL-seq 技术。这种方法最大程度地减少了核酸丢失的风险但是会导致DNA测序的污染。第二种方法是基因组和转录组测序(G&T-seq),mRNA通过与包裹寡聚(dT)的顺磁珠结合而与gDNA分离。使用改良的Smart-seq2方法扩增mRNA,而将DNA进行WGA和常规文库制备。第三种方法将同一细胞细胞核和细胞质分开,从而可以对细胞核进行基因组分析或表观基因组分析,对细胞质RNA进行转录组分析,但是这种方法会丢失细胞核转录本等信息。
单细胞表观基因组+转录组
表观基因组在很大程度上决定了细胞如何读取基因组并产生转录组。然而,单细胞表观基因组与转录组的关联在很大程度上取决于单细胞分辨率。另外,可以阐明细胞状态转变和细胞分化过程中转录组和表观遗传学变化的因果关系。
单细胞三重组学测序技术(scTrio-seq)可以同时分析单个细胞的基因组拷贝数变异,DNA甲基化和转录组。将单个细胞温和地裂解成完整的细胞核、细胞质mRNA。mRNA转换为scRNA-seq文库,scRRBS方法处理细胞核分析甲基化及DNA拷贝数。单细胞甲基化和转录组测序(scMT-seq)与scTrio-seq相似,裂解细胞膜但不裂解核膜,通过微毛细管分离细胞核。mRNA使用Smart-seq2方法,核基因组使用scRRBS方法进行。scM&T-seq基于G&T-seq方法,但在物理分离DNA和RNA之后将scBS-seq用于gDNA测序,与scTrio-seq和scMT-seq相比,scM&T-seq可提供更宽的细胞CpG甲基化范围。基因型、表达和甲基化的单细胞分析(scGEM)是在Fluidigm C1单细胞自动制备系统中分离并裂解单细胞,并将mRNA转化为cDNA,使用改进的SCRAM分析。使用针对特定cDNA和gDNA基因座的引物在芯片上进行PCR预扩增,以进行DNA甲基化和基因型谱分析。
除此之外,还有一些技术可以分析单个细胞的多种表观基因组。单细胞全基因组核小体定位及DNA甲基化组测序技术(scNOMe-seq)利用M.CviPI GpC甲基转移酶,来特异性地甲基化开放染色质区域(即非核小体DNA)中的GpC二核苷酸。这种方法具有两个优点:一是可以更好的区分方法未被甲基化的核小体和技术原因导致的未检测到的情况;二是分辨率更高,由基因组中GpC位点的频率决定(1/16 bp),而不是插入片段大小(>100 bp)。
单细胞表观多组学测序技术(scCOOL-seq)是scNOMe-seq的替代方法,不仅分析染色质状态和DNA甲基化,还可以对DNA拷贝数变异和倍性进行分析。该方法通过1-Mb基因组区域中测序深度并结合了隐马尔可夫模型来确定拷贝数片段,同时将相同数量的λDNA掺入每个单细胞样品中以推导细胞的倍性。scNMT-seq结合了scNOMe-seq和scM&T-seq的原理。通过流式细胞仪将单细胞分离,按照scM&T-seq方法对DNA和RNA进行物理分离和处理,然后使用scNOMe-seq的原理来测量染色质的可及性和DNA甲基化,而转录组信息则由修改后的Smart-seq2方法检测。
单细胞转录组+蛋白质组
了解转录本如何翻译为蛋白质对于理解转录组细胞状态如何翻译为功能性表型状态非常重要。另外也揭示由于转录后和翻译后过程中的潜在异质性,而导致通过scRNA-seq可能无法观察到的表型细胞状态。
通过将邻位延伸分析技术与靶向cDNA扩增相结合,可以同时测量单个细胞中蛋白质和转录水平。通过一对在同一蛋白不同抗原决定簇结合的抗体对目标蛋白进行双识别,当两个抗体结合目标蛋白后导致抗体上偶联的单链DNA寡核苷酸靠近并互补连接。然后利用具有RNA聚合酶活性的逆转录酶将上述目标蛋白上的DNA标签扩增,同时将RNA合成cDNA,因此可以通过qPCR或测序来同时测量蛋白质和转录水平。这项技术能够同时测量38种蛋白质和96个转录本。
在另一种方法中,通过FACS分离细胞并进行裂解,然后将裂解液分开以分别测量RNA和蛋白质。测定蛋白质时使用邻近延伸分析技术,测定RNA时进行逆转录,然后通过微流体qPCR检测。
RNA的邻近连接分析测定(PLAYR)方法中,通过质谱流式检测特定的转录本和蛋白质。PLAYR探针与目标转录本杂交后可以形成一个环,做为后续滚环扩增的模板,进一步使用带有金属同位素标签的探针标记后就可以在质谱流式仪上检测。尽管这可以快速分析成千上万个单细胞的RNA和蛋白质,但受到可用的金属同位素标签数量以及高亲和力抗体数量的限制。
细胞索引转录组和抗原决定簇测序技术(CITE-seq)使用带有寡聚核苷酸的功能化抗体标记到细胞表面蛋白,这些寡聚核苷酸包含PCR识别位置、抗体条形码和poly(A)尾巴,并通过链霉亲和素-生物素相互作用与抗体偶联,同时5’末端的二硫键在还原态时会释放寡核苷酸。在Drop-seq珠或10x Genomics Chromium凝胶珠存在时,抗体衍生的标签和细胞的mRNA与珠上的oligo(dT)结合,逆转录和扩增后,可以按大小区分cDNA和抗体衍生的标签,将其集合在同一测序通道中。原则上这种技术也可以用于细胞内蛋白的测序。值得注意的是,这项技术可以检测无法单独通过scRNA-seq区分的自然杀伤细胞亚型。
REAP-seq采用的也是寡核苷酸交联抗体来检测细胞蛋白质和转录物水平,但与CITE-seq不同的是,REAP-seq使用Thunder-Link PLUS寡核苷酸偶联系统将寡核苷酸连接至条形码。也是通过片段大小区分蛋白质与转录组,可以并行检测82种蛋白和scRNA-seq。
展望
这里将介绍两种多组学技术的应用,一种是癌症,这项技术给我们一个全新的视角;另一个是人类细胞图谱计划,这项技术可能具有更大的潜力。
癌症
肿瘤包括不同亚群的癌细胞以及提供支持的基质细胞。大量组织的DNA或RNA分析不能满足对癌细胞突变的精确解析,包括突变发生的顺序以及癌细胞中基因组多样性的程度、性质和功能后果。同时研究人员对遗传导致的多种癌细胞状态的理解仍然有限,为什么某些癌细胞转移和/或对治疗无效。同时基质细胞群体的异质性是导致肿瘤微环境的关键因素。基质细胞从宿主中分化并促进细胞外基质重塑、细胞迁移、新血管生成、侵袭、耐药和逃避免疫攻击等过程,而这些过程仍存在很多疑问。了解癌症中细胞异质性对于设计有效的治疗方法至关重要。
单细胞多组学方法可以为肿瘤内细胞异质性的发展提供新的见解。例如,基因组加转录组测序的方法,例如DR-seq,G&T-seq和微流体,可以确定亚克隆的遗传结构和系统发育树,从而揭示癌细胞获得突变的顺序。对相同细胞的scRNA-seq分析将解析肿瘤内可能发生的功能差异,从而分析不同表型癌细胞状态受遗传和/或非遗传突变影响的程度。将这些数据与来自相同细胞的蛋白质组结合分析可以更深入地了解细胞之间的功能差异。同样,对相同细胞的表观基因组分析可以进一步了解导致不同细胞癌状态的分子过程。还可以将相似的技术应用于循环肿瘤细胞和扩散性肿瘤细胞比较、癌细胞扩散和休眠的遗传和非遗传机制、基质细胞的分子亚群及其与附近的癌细胞相互作用。除了对肿瘤发展的基本了解之外,单细胞多组学方法还能够用于肿瘤细胞耐药机制的解析。
人类细胞图谱计划
scRNA-seq揭示细胞(亚型)和表型状态的能力导致细胞图谱计划的启动。细胞图谱计划将使人们对生物体的正常发育以及细胞过程失调如何导致衰老和疾病产生更深刻的基本了解。尽管最初将基于在scRNA-seq,但仍需要单细胞多体组学来提供更深入了解。
单细胞多组学技术正在迅速发展,生成越来越大的scRNA-seq数据集。通过提高现有的单组学技术(包括scRNA-seq,scDNA-seq和单细胞ATAC-seq)的敏感性和准确性,单细胞多组学技术能够得到进一步的发展。随着捕获更多种类的RNA,更多的靶蛋白和更多的DNA修饰,也拓宽了这些组学的范围。代谢组学目前在单细胞水平上应用极具挑战性,但正在取得进展。
技术的发展可能导致更多的组学结合。long-read技术可能可以同时检测到DNA序列和DNA甲基化以及其他DNA在同一分子上的标记。结合scRNA-seq的高分辨率空间信息捕获能力可以扩展为包括其他核酸或抗体标签的捕获。活细胞成像与单细胞序列的更大关联性可以允许分析更复杂的表型。核结构也没有能够与同一细胞的RNA或蛋白质的分析相结合。期望通过进一步结合现有技术而达到四层组学或五层组学结合。另外,使用组合索引或微流体方法能够对数千个细胞进行高通量处理。通过缩小反应量可以降低文库成本。此外还需要开发新的多组学算法,以允许对多个细胞的单细胞数据进行综合研究。在未来几年可能会在“全组学”方面取得更大的进步。多组学技术最终旨在针对细胞的所有层次进行表征,包括“组学”层次、三维空间、表型及细胞谱系。
评论
单细胞组学是最近研究的热点,让我们深入的认识到细胞间的的异质性在生长发育、疾病尤其是肿瘤的发生等多方面的重要作用。而对于生命体,基因、转录、蛋白、代谢等多层面生物功能的关联和协调是细胞行使生物学功能的基础,因此将以上各种组学整合大大促进了人们对于生命的理解。本文正是针对单细胞组学技术日趋成熟、单细胞多组学技术逐渐兴起的现状,从技术层面为大家综述了包括了各种单细胞单组学及单细胞多组学联合的方法,详细的阐述了各种技术的原理及其优势、不足,其中涉及多种最近开发的新技术,同时作者提出将空间信息作为组学分析的辅助层面,为研究者根据研究问题选择使用何种单细胞组学及多组学技术提供参考。同时作者在最后简述了单细胞多组学技术在肿瘤及人类细胞图谱计划,并指出单细胞多组学技术发展的方向。相信随着技术的不断发展,单细胞多组学必将成为生物学研究的重要工具。
拓展阅读
1. Trends in Cancer | 单细胞转录组评论:癌细胞状态的可塑性和克隆性(一区:IF=8.884)
2. Nature子刊 | 用于组织原位分析的高分辨率空间转录组学
3. 科研 | CURR OPIN BIOTECH:单细胞转录组学方法学和应用综述(1区IF:8.083)