科研 | Genome Biology | 英国威康桑格研究所:scRNA-seq评估冷藏后人肺、脾和食道组织的稳定性

编译:不二,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

背景:人体细胞图谱是一项大型的国际合作项目,旨在绘制人体所有细胞类型。单细胞RNA测序可以生成高质量的数据,绘制此类图谱。但是,新鲜样品收集和处理之间的延迟可能会导致数据质量差和实验设计困难。

结果:本研究评估了超过5个供体冷藏超过72h对新鲜健康脾脏、食道和肺的影响。研究者收集了240000个高质量的单细胞转录组,其中包含详细细胞类型的注释和供体的全基因组序列,从而可以进行eQTL研究。该数据为研究这三个器官提供了宝贵的资源,并允许器官之间比较细胞类型。在最初的24h内,发现冷缺血时间对细胞产量、每个细胞的reads总数以及其他质量控制指标几乎没有影响。但是,研究者观察到72h的肺T细胞的比例减少,线粒体reads的百分比升高,并且72h脾脏样本中背景环境RNA的污染增加,这是细胞类型特异性的。

结论:总之,在scRNA-seq分析之前,作者提出了用于组织储存24h的可靠方案。这极大地方便了人类细胞图谱或临床研究的样品收集的后勤工作,因为它增加了样品处理的时间范围。

论文ID

原名:scRNA-seqassessment of the human lung, spleen, and esophagus tissue stability after coldpreservation

译名:冷藏后人肺、脾和食道组织稳定性的scRNA-seq评估

期刊:Genome Biology

IF:14.028

发表时间:2019.12

通讯作者:K. B. Meyer

通讯作者单位:英国威康桑格研究所

DOI号:10.1186/s13059-019-1906-x

实验设计

本研究以人类脾脏、食道和肺作为实验材料,分别选取立即处理时间点(T0)及4°C冷藏缺血12h、24h和72h时间点,进行冷冻切片HE染色及TUNEL分析。并对不同样本不同时间点分别进行普通RNA测序及单细胞测序,对每个捐献者个体进行全基因组测序(WGS)。汇总所有测序数据经过质控和过滤后进行生物信息学分析。

结果

冷藏后scRNA-seq数据质量良好

研究者从12个器官供体获得了肺、食道和脾脏样本。移植外科医师评估每个器官在外观上总体健康。对每个个体进行全基因组测序(WGS),确认研究参与者总体基因组没有异常。此外,对于每个供体,从每个组织的12h或24h时间点进行组织切片,并用苏木精和伊红染色,并由病理学家进行评估。证实了所有组织切片都是健康的,除了一位可能患有肺动脉高压的供体。组织切片之间的异质性,例如腺体的存在以及某些切片中炎症的数量可能会影响scRNA-seq的分析。

肺实质、食道中部和脾脏(n≥5;图1a)的样本在收集后(在停止冷灌注2h内)立即放入4°C HypoThermosol FRS溶液中。直到用于scRNA-seq之前,一直保持在4°C。对于大多数供体的肺(n=5),在运输到实验室进行普通RNA测序之前,还需要在诊所(最早的时间点)将组织块速冻。运输后,将新鲜样品立即解离(T0)或在处理成单细胞悬液之前于4°C冷藏缺血时间12h、24h或72h(图1b)。T0时间点的变化取决于器官移植过程的时间、在诊所收集样品所需的时间以及快递的时间(从血液循环停止到实验室接受组织平均需要冷缺血4h)。其他处理时间点是在T0之后的12h、24h和72h。通过scRNA-seq分析细胞(图1c)。在每个时间点,也进行普通RNA-seq分析。

在对scRNA-seq数据进行比对和标准化后,评估所有样品的质量控制指标(图1)。对于肺和食道,每个样本的测序reads、每个样本的细胞数、每个细胞的基因中位数以及其他质量指标并未随时间显著变化,但是研究者观察到72h脾脏的变化(图1b–d)。除72h的脾脏外,所有样本中可靠地映射到转录组的reads百分比(QC=255)均稳定(图1e)。RNA质量良好且在任何组织中均未随时间变化(大多数普通RNA-seq样品的RIN>7,但脾脏中四个质量较低的异常主要来自单个供体)。就质量指标而言,没有检测到在冷缺血24h内与冷藏有关的变化。

图1在冷藏至少24h后scRNA-seq质量指标保持稳定。

72h脾脏的scRNA-seq数据质量降低

尽管大多数质量指标不会随时间变化,但进一步研究了脾脏中观察到的可映射reads的下降。发现仅在脾脏中观察到外显子reads百分比的显著下降(图2a,b)。此外,内含子的reads百分比随在脾脏储存时间的增加而增加,但不随肺和食管的储存时间的增加而增加(图2c,d)。脾脏在72h时高质量reads比例的变化(图2b,c)可能会导致细胞类型特异性差异。当仅随时间检查细胞的顶部和底部四分位数(内含子和外显子比对)时,内含子和外显子reads之间的这种偏离变得更加明显。该结果表明非剪接的reads对于降解更稳定。

接下来,评估了线粒体reads的比例。这是一种常用的质量指标,它表示例如组织解离或储存引起的细胞压力。具有高百分比线粒体reads的细胞通常被排除在分析之外。在本研究数据中,线粒体reads的比例很低,比例没有显著变化,除了脾脏中5个供体中的4个,72h的线粒体reads增加了(图2e,f)。当检测线粒体百分比高于10%的细胞数量时,结果更加明显,线粒体百分比仅在脾脏中随时间显著增加(图2g)。

图2 与其他器官相比,脾脏中数据质量损失随时间的探索。

时间对双峰率和空液滴的影响

计算每个样品中每个细胞的双峰得分,三个组织中的任何一个都不随时间变化。接下来,评估了非细胞液滴的变化。所有液滴测序反应均产生许多不包含细胞但捕获了无细胞mRNA的液滴,通常称为“环境RNA”或“soup”。研究者通过reads深度对UMI的数量进行标准化,并设置阈值将“环境RNA”定义为0-0.25,“碎片”定义为0.25-5,“细胞物质”定义为每个液滴>5标准化的UMI(图3a),来反映reads的分布。在任何这些时间间隔中,含UMI的液滴比例不受脾脏、肺或食道时间的影响。然而,在脾脏中,标准化UMI的平均数在碎片中增加了,而在72h细胞液滴中下降了(而不是24h)(图3b,c)。在肺或食道中未观察到此现象,但注意到在所有三个组织中,碎片和细胞物质的平均值变化很大。

脾脏碎片的增加可能表明72h细胞死亡增加了。解离后,研究者观察到样品之间细胞活力的显著变化,可能是生物学(供体变化)或技术(可能是由于整个研究过程中样品是由多个操作人员手动计数的)来源的。但是,去除死细胞后,活力评分变得更加一致。为了评估解离之前组织中的细胞活力是否发生了改变,对来自所有三个组织的T0和72h组织切片进行了TUNEL分析,观察凋亡细胞。TUNEL染色强度在单个样本之间和内部都不同,染色明显不规则。所有三个组织在72h都有较高的染色趋势,但是脾脏中的T0染色高于其他两个组织。总体而言,这些发现与以后的时间点增加的细胞死亡以及在脾脏中观察到的更大的细胞死亡效应是一致的。

由于应在洗涤步骤和细胞计数中去除死细胞,因此研究者认为在测序数据中不会观察到凋亡后期的细胞。但是,确实在72h内观察到了脾脏中的更多碎片,这表明长时间存放后对解离的敏感性增加。

图3 数据质量损失与数据中环境RNA及碎片reads增加有关。

细胞类型的注释

来自Cell Ranger输出的基因表达矩阵用于对整个组织或特定亚群的细胞进行顺序聚类。通过观察已知细胞类型标记基因的表达来确定和注释细胞簇的细胞类型身份(图4a–c)。重要的是,所有时间点和至少四个不同的供体对所有三个组织中的每种细胞类型都有贡献(图4d-f)。

在肺中,有57020个细胞通过了质量控制,代表了25种细胞类型。研究者从血液和淋巴管中检测到纤毛、肺泡1型和2型细胞,以及成纤维细胞、肌肉细胞和内皮细胞。从免疫区鉴定出的细胞类型包括NK细胞、T细胞和B细胞,以及两种巨噬细胞、单核细胞和树突状细胞(DC)。多个DC群体(例如常规DC1,浆细胞样细胞)对每个细胞簇都有贡献。分裂细胞形成了T细胞、DC、单核细胞、NK和巨噬细胞的不同细胞簇。

食道产生了87947个细胞,其中90%以上属于四种主要上皮细胞类型:上层、分层、上基底层和分裂细胞。来自上皮基底层的其他细胞更紧密地聚集在腺管和粘液分泌细胞上。尽管所有供体都为基底层做出了贡献,但在总共23个食道样本中,只有2个样本提供了大部分的黏液分泌细胞(占总数的0.06%;55个细胞;样本325C,12h和356C,72h)。食道中的免疫细胞包括T细胞、B细胞、单核细胞、巨噬细胞、DC和肥大细胞。有趣的是,几乎80%的肥大细胞(87个细胞)来自单个供体(296C)。在该供体中还发现其他免疫细胞(B细胞、DC、单核细胞/巨噬细胞)的比例增加。该捐献者是唯一接受过MACS去除死细胞的捐献者,后来由于担心丢失更大的细胞类型(例如上皮细胞)而被排除在实验方案之外(296C中所有细胞的0.5%,在所有其他捐献者中超过7%)。此外,该供体被诊断出患有呼吸相关的肺炎,小鼠中的一些报道表明肥大细胞与肺炎感染之间存在联系。

来自脾脏的所有94257个细胞均注释为免疫细胞。卵泡和冠状带B细胞被鉴定为最大的组,分别为17%(>16000个细胞)和20%(>18000个细胞)。通过AICDA的表达对可能经历成熟的B细胞进行注释,并以0.5%的频率进行检测(437个细胞)。检测到超过6000个浆细胞并注释为浆母细胞、IgG或IgM表达的浆细胞。大约90%来自一个356C捐献者,这与显示该捐献者胸部感染的医疗记录一致。超过28000个T细胞被注释为CD4+常规细胞、CD8+激活细胞、CD+4幼稚细胞、CD4+卵泡辅助细胞(fh)、CD8+MAIT样细胞、CD8+γδ细胞、CD8+细胞毒性淋巴细胞(CTL)、CD4+调节性细胞或分裂T细胞。还鉴定了两个自然杀伤(NK)细胞的亚群、一个分裂的NK细胞种群、单核细胞、巨噬细胞和DC细胞。多个细胞群的比例非常低,例如DC的亚群,包括激活的DC(0.04%)、常规的DC1(0.3%)和pcDC-s(0.3%),以及先天性淋巴样细胞(0.6%)、CD34+祖细胞(0.2%)、血小板(0.08%)和位于T细胞和B细胞簇之间的未知细胞群(0.1%)。包含超过2207个同时表达T细胞和B细胞标记的细胞组代表了相互作用的细胞双峰,称为T_B双峰。除浆细胞群外,供体356C中的其他细胞比例也较高,如T_B双峰、常规DC1和DC2、DC浆细胞样细胞和巨噬细胞等多种其他细胞类型。没有检测到基质细胞,这很可能是由于脾脏没有酶消化来释放细胞。

组织处理标记基因

研究者还对每个供体在每个时间点进行了普通RNA测序,以评估基因表达随时间的变化而无解离误差,并使研究者能够确定哪些基因会随解离而改变,或者特定细胞群是否丢失。在UMAP作图中,普通和单细胞测序样本主要通过测序方法和起源组织进行聚类,但不根据时间点进行聚类。先前的工作强调了酶促组织解离对基因表达模式的影响。差异表达分析是通过Wilcoxon符号秩检验在每个组织的普通测序样本与单细胞测序样本之间进行的。通过Benjamini和Hochberg(BH)方法对p值进行了多次测试校正。所有三个组织中,单细胞测序对于普通测序差异变化最大的基因都富含核糖体基因。另外,在所有三个组织中,单细胞测序中较高水平表达的前20个基因中都出现了一个较长的非编码RNA “MALAT1”(在肺、食道和脾脏中调整后的p值<0.002)。当三个组织结合在一起分析时,单细胞测序样本中的核糖体基因(调整后的p值为1.15×10-6)和MALAT1(调整后的p值为1.15×10-6,中值log2倍数变化为-4.4)也高度富集。单细胞测序样本中所有与解离相关的FOS、FOSB、JUN和JUNB基因均显著高于普通测序样本,调整的p值分别为1.56×10-7、2.3×10-10、8.7×10-6和6.13×10-9。在已报道的解离标记基因中也发现了核糖体基因和早期反应基因的差异表达。

研究者还进行了差异基因表达的组织特异性分析。大量高表达的基因源自对解离敏感的细胞类型。在肺单细胞测序数据中,肺泡细胞非常稀少,但在组织中却很丰富。这导致标记基因AGER和表面活性蛋白质编码基因SFTPB、SFTPA1和SFTPA2的差异表达。在肺的普通测序和单细胞测序之间具有高倍数变化的其他基因是血管内皮标记基因VWF和PECAM1。在食道中,基质细胞标记基因FLNA和MYH11以及KRT4和KRT5在大多数角质形成细胞中表达,并且这些基因在普通测序中比单细胞测序要高。在脾脏中,重要的基因包括巨噬细胞中高度表达的APOE、CD5L、VCAM1、HMOX1、C1QA和C1QC。这表明本研究的样品处理方案主要影响肺中的肺泡和血管细胞、食道中的基质细胞以及脾脏中的巨噬细胞。

图4 不同器官鉴定出的细胞类型随时间变化。

特异细胞类型的变化

注释了细胞类型后,可以研究细胞类型比例随时间的变化。样品之间和供体之间的细胞类型比例差异很大(图4d-f)。当检测供体中细胞类型随时间的变化时,注意到脾脏中B细胞的比例增加,而肺和脾脏中T细胞的比例则随着储存时间的减少而减少。比较各个时间点后,经过多次测试校正后,这些变化均无统计学意义。但是,研究者确实观察到,将T0、12h和24h时间点与72h时间点进行比较时,肺中CD4+T细胞和CD8+细胞毒性淋巴细胞的比例降低了(BH校正的p值<0.01)。

研究者检查了储存时间对特异细胞类型转录组是否有影响。值得注意的是,根据变化的基因绘制的UMAP图并没有显示出明显的时间效应(图4g,h)。联合所有组织的基因表达矩阵,并计算了由不同变量解释的变异性百分比。图4j显示,可变的供体、组织、细胞类型和计数数量占所解释方差的最高部分,而储存时间的影响贡献最小。当对每个组织进行分析时,情况仍然如此。

检查了观察到的线粒体reads随时间增加(脾脏72h;图2e–g)是否是由于特定的细胞类型引起的。为此,通过相似性将具有高线粒体reads的细胞分配给一种细胞类型。对于每种细胞类型和组织,计算线粒体百分比及其相对于T0的倍数变化(图5)。72h脾脏中出现最高的倍数变化。尽管这种作用在多种细胞类型中均很明显,但在浆细胞中尤为明显,在浆细胞中,这种作用在贡献大部分这种细胞类型的两个供体中可以独立重复出来(图5a)。

接下来,将相似的细胞类型合并为更大的细胞簇,以进行更可靠的分析。在每个这些细胞簇中,由时间点解释的变异性百分比非常低(图5b),尤其是与诸如供体和reads数之类的变量相比(图4j),突出表明对于几乎所有细胞类型,冷藏时间没有重大影响。

检查了每种细胞类型中哪些基因随储存时间的变化最大。这种分析是在每个器官的基础上进行的,因为来自不同细胞类型的冷藏标记基因的聚集主要是由器官起源而不是细胞类型造成的。例如,按器官分组的T细胞、自然杀伤细胞和单核细胞/巨噬细胞的冷藏介导的标记基因。此外,在大多数样品中,促成这种相似性的基因是导致周围RNA污染的最重要基因之一。例如,在脾脏中,浆细胞特异性基因(例如JCHAIN,IGHA1和IGLC3)的环境RNA含量较高,并且代表了冷藏标记基因。该观察结果与在浆细胞中观察到的高线粒体百分比(由于应激或细胞死亡)一致(图5a)。此外,观察到与解离相关性最强的基因(校正后的p值<0.01和中值log2倍数变化<-2)中冷藏标记基因的过量表达。发现在所有三个组织中,与解离相关的标记基因的重叠均高于偶然发生的基因重叠(肺、食道和脾的p值分别为2.2×10-16、2.05×10-14和2.2×10-16)。这可能是由于细胞随着储存时间的解离变得更加敏感,或由于储存时间和解离而激活的类似应激信号。因此,在储存时间内观察到的低水平的基因表达变化很可能是由压力诱导的细胞死亡并导致环境RNA污染所造成的

在T0和其他时间点之间的普通RNA测序中的成对差异表达分析,在任何组织中均未产生明显的基因,进一步表明观察到的变化都非常小。对于肺部,研究者还在采集后立即在诊所冷冻样本,并将该样本与以后的时间点进行比较。同样,没有检测到显著差异表达的基因。

观察到基因表达随时间的变化很少,这似乎令人惊讶,特别是考虑到其他研究(例如GTEx数据库)确实证实了这种作用。但是,要注意的是,GTEx使用的是尸检的温热样本。本研究旨在模拟器官移植过程,在该过程中,用HypoThermosol FRS快速去除小鼠肾脏的组织,并且在72h内基因表达几乎没有变化。因此,尽管确实会在某些储存条件下发生快速的基因表达变化,但至少对于本研究中测试的器官而言,似乎可以通过在低温储存培养基中保持样品低温来限制这些基因表达。总之,这对于新鲜的生物样本(包括供体的活检样本)在临床上的采集时间、运输到实验室以及在方便处理之前的储存方面的进一步研究非常有用。

器官细胞类型的映射

在生成了食道、肺和脾脏的数据集之后,检查了所有三个器官中找到的细胞类型(例如免疫细胞)是否会按器官或细胞类型聚集。图5c显示了每个细胞类型、组织、时间和供体最多使用10个细胞的情况下,1000个基因进行分层聚类的结果。在对大约7500个细胞的分析中,观察到肥大细胞、巨噬细胞和浆细胞的清晰亚群,某些亚结构取决于供体和组织起源,表明更深入的分析可以研究不同免疫细胞的组织适应性。其他细胞(例如B细胞)分为两组,并且分裂细胞(NK,巨噬细胞,T细胞)也共同分离。但是,样本不会按时间聚集。

细胞类型贡献的变化

本研究的单细胞解离方案旨在捕获每个器官中存在的细胞类型的多样性,但并不代表每种细胞类型在原始组织中所占的比例。例如,用于肺部的组织解离方案极大地丰富了免疫细胞类型。在样品之间可以看到细胞类型比例的相对较高的变异性。这可能是由于技术变化以及潜在的生物学变化所导致的,如仅在某些食道样品(即供体325C和356C)中捕获稀有细胞(如腺细胞)。有趣的是,在来自供体325C切片的组织学检测(12h)证实存在其他食道样品切片中不存在的腺体(粘液分泌细胞)。其他所有样品包含少于五个粘液分泌细胞。这说明从稀疏分布的结构中(例如食道中的腺体)收集细胞的困难,并表明某些样品之间存在差异是由于所分析的特定组织切片的结构存在根本差异。对于血管也观察到类似的结果(图4e;367C,72h)。此外,在一个组织学切片(362C,24h)中观察到的免疫细胞浸润可能反映了单细胞水平上免疫细胞(B细胞,T细胞和单核细胞/巨噬细胞)的增加(图4e;362C,24h)。

总之,观察到供体之间的变异大于样品之间的变异。每个组织的所有细胞类型总共72种,随时间变化的统计检验(t检验)仅产生两个显著变化(如上所述)。但是,当测试供体之间的差异时,发现在72种组合中的29种中,至少1种供体与其余供体相比,细胞类型的比例显著不同(单侧方差分析,经BH校正的p值<0.05)。供体之间变化最大的细胞类型是肺中的肥大细胞。其他例子包括脾脏和肺中的NK细胞以及食道中的分裂上皮细胞(图4d–f)。供体之间的高变异性表明,对于人类细胞图谱需分析大量供体以了解“正常”范围。

图5 转录组中特异细胞类型的变化。

结论

本研究提出了一种用于冷藏人体原始组织样品的方法,该方法不需要在临床现场进行样品采集以外的任何处理,并且至少需要24h的运输、组织解离和scRNA-seq过程。所有测试指标显示,肺和食道在72h内保持稳定。在脾脏中,研究者在72h观察到内含子和外显子reads比例的变化以及线粒体reads百分比的增加。证实在收集组织样品后立即储存组织样品于冷组织储存溶液中,可以使各种不同细胞类型中缺血的后果最小化。作者认为时间对scRNA-seq数据中的细胞群体多样性或24h内普通RNA-seq的变化没有影响。这种方法易于采用,将极大地促进人类细胞图谱研究的样品采集。研究还强调了由于组织样品的解剖异质性和供体之间的显著异质性导致的细胞类型分布的变化,这将影响未来的HCA研究设计。

此外,研究者已经在三种主要的人体组织上生成了详细的注释:脾脏,食道和肺。这个超过24万个单细胞的数据集为进一步研究这些组织的生物学功能提供了重要的资源,并且包含迄今为止最大的食道和脾脏数据集。此外,本文提供了来自13位健康捐献者的WGS数据,包括临床数据,可用于未来的组织特异性单细胞eQTL研究。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐