单细胞解析转移性胃癌肿瘤内异质性和谱系多样性
文章信息
文章题目:Single-cell dissection of intratumoral heterogeneity and lineage diversity in metastatic gastric adenocarcinoma
期刊:Nature Medicine
日期: 2021年1月4日
DOI:https://doi.org/10.1038/s41591-020-1125-8
摘要
肿瘤内异质性(ITH)是肿瘤的重要特征,但它的起源仍然不为人所知。文章对15例胃癌(GAC)患者的腹膜癌(PC)进行了单细胞转录组分析,构建了45048个PC细胞的图谱,分析了肿瘤细胞群的转录组状态,深入探讨了恶性PC细胞的ITH,并确定了与患者生存的显著相关性。研究发现了PC标本中肿瘤细胞谱系/状态成分的多样性,ITH的单细胞分析,将PC标本分为两种亚型。开发了基于12个基因的预后特征,在多个大规模GAC数据中得到证实,可用于患者分类。
背景
GAC仍然是一种常见的和致命的疾病,预后差。GAC通常在晚期被诊断出来,通常对治疗有抗药性。常见的转移部位是腹膜腔(peritoneal carcinomatosis,PC),改善晚期GAC患者的治疗干预尚有很高需求。因为患者通常没有分类,合理的治疗非常有限。ITH是肿瘤细胞生存的基础,导致了治疗耐药性,是改善患者预后的主要障碍。深入了解ITH的细胞/分子基础可以干预GACs的治疗。
结果
20例晚期GAC患者的PC细胞(10例长期存活者和10例短期存活者)进行PC scRNA-seq的单细胞转录组图(图1a)。经过过滤,45048个细胞被保留用于后续分析。捕获了五种主要的非恶性细胞类型: B细胞、CD4 T细胞、CD8 T细胞、髓细胞和成纤维细胞。一个多步骤的分析方法用于区分恶性PC细胞。不同患者的免疫细胞按细胞类型聚集在一起,而PC恶性细胞明显按患者聚集。来自短期存活者的肿瘤细胞簇在UMAP分类,树状图上和Bhattacharyya距离中都更接近。在本研究中,关注的是PC肿瘤细胞(n = 31,131)。其中5个患者肿瘤细胞太少(< 50)被排除。分析PC肿瘤细胞的转录组,进行无监督cell-clustering分析,结果说明使用t-SNE和UMAP发现了14个独特的细胞群,表现为样本特异,有高度的肿瘤细胞内异质性。
这项研究包括10名短期幸存者和10名长期幸存者。
推测肿瘤细胞谱系
为了绘制每个肿瘤细胞,确定PC的潜在起源细胞,使用了HCL数据库作为参考。尽管所有病例临床诊断都鉴定为PC,但最终只有约70%的PC肿瘤细胞定义为胃来源(stomach origin: pit cells, mucosal cells and chief cells),另有一组PC肿瘤细胞(26%)的表达谱类似于其他胃肠道(GI)器官的细胞,特别是肠道(intestine),并排除其他因素影响。DEG分析了细胞系特异表达基因,包括类结直肠,类十二指肠和胃细胞,以及直肠癌肠上皮细胞和杯状细胞之间。
肿瘤细胞谱系组成的多样性在转录组、基因型和分子水平上与ITH相联系
进一步研究转录组,检查其与肿瘤细胞谱系组成的关系。使用Seurat和Monocle对PC肿瘤细胞进行无监督聚类分析,UMAP分析,观察到胃细胞与colorectal-like细胞分别有独特特点。病例IP-009中,单细胞共识聚类(SC3)对肿瘤细胞进行了非监督聚类分析,不同细胞系的组成具有显著差异。例如,通过SC3将IP-067的肿瘤细胞分为四个簇。C1簇中的细胞主要是胃来源(96.5%),只有3.5%的细胞是大肠样,而C4簇中的细胞主要是肠源的细胞,其中71.4%的细胞是大肠样。标记基因同样特点。结果表明,肿瘤细胞谱系组成的多样性可能是转录组学的一个原因。
使用Bhattacharyya距离表明colorectal-like细胞与胃坑(或粘膜细胞)的谱系间差异明显比谱系内更大,表明不同于细胞来源。通路富集分析,显示代谢和致癌途径的活性不同,表明肿瘤固有信号通路可能促进了观察到的患者间转录组异质性。
研究PC肿瘤细胞的基因型ITH,并检查了其与推断的肿瘤细胞谱系的关系。从scRNA-seq推断出大规模拷贝数变异(CNVs),然后进行系统发育重建分析。与来自大规模全外显子组测序(WES)数据的CNVs总体上具有良好的相关性。
部分PC标本表现出较高的ITH水平。IP-067是一个典型的例子。系统发育重建分析发现5个亚群(B1-5)具有不同的CNV图谱。CNV亚克隆结构模式与推断的肿瘤细胞谱系一致:最大的亚群B5显示结肠样转录组学特征,与单纯由胃系细胞组成的亚群B2在多染色体上显示不同的CNV图谱。B5细胞富集在细胞簇C1中,而B2细胞主要集中在C3簇中, C3簇与C1明显分离。来自与B2或B5具有共享CNV图谱的簇B1、B3和B4的细胞主要富集在连接簇C1和C3的单片细胞簇C2中。体细胞变异分析显示,在C1细胞中发现的体细胞突变中,有36%在C2或C3细胞中未检测到,只有26%的突变在三个集群中是共享的。
a,有代表性的样本,IP-067。b,另一个代表性样本,IP-009。c,不同肿瘤细胞谱系中肿瘤细胞增殖特性的比较。d,周期细胞(G2M期或S期细胞)和非周期细胞在推断的细胞谱系中的比例。e,小提琴图的代表性细胞周期相关基因在不同肿瘤细胞谱系/类型的差异表达(P < 2.2×10−16)。
研究了肿瘤细胞的增殖特性及其与推断的肿瘤细胞谱系的关系:基于细胞周期相关特征基因的表达谱分析显示,胃窝细胞的增殖性能最高,表现为高G2M和S score和循环细胞比例。这与之前观察到的胃坑细胞的细胞周转速度比胃的粘液分泌细胞快一致。
17q拷贝数几乎是胃细胞起源独有,并与低生存率相关
我们发现17q拷贝数获得作为一个独特的事件,存在于胃肿瘤起源细胞中,且只存在短期幸存者(图3)。通过整合基因型和转录组谱,从17q明显增加的病例(与无17q增加的病例相比)中确定了一组与患者生存相关的肿瘤细胞17q上调基因列表(图3b,c和补充表8)。其中一些涉及关键信号通路的上调基因(如PI3K/AKT/mTOR、mTORC1、MYC),也是潜在的治疗靶点(如HN1、GRB2、PSMB3)。来自TCGA的两个数据验证显示,肿瘤增加17q的患者生存率明显较差。
a,所有肿瘤细胞推测的大规模拷贝数变异b,热图显示了三个短期存活者(底部标记的样本id)的上调基因的比例表达值,有明显的17q增加(在顶部轨道注释),一个短期存活者和七个长期存活者,没有可检测的17q变化。c,从b.中选择的8个基因的代表性小提琴图。d,e, 17q拷贝数增加与TCGA初级GAC队列中患者生存较差相关(d) (n = 411;只纳入有生存数据的病例)和一个独立的GAC-PC队列(e) (n = 45)。
细胞信号转导不均一性与肿瘤细胞谱系/状态相关
为了更好地理解与患者生存相关的生物学程序,对>900个基因集进行了通路富集分析。其中,80条通路在推断的肿瘤细胞谱系中有差异表达(图4a),其中37条通路也与患者生存密切相关(图4b和补充图20)。根据它们的生物学功能,将这些途径分为五大类:致癌信号传导,细胞周期,DNA修复,代谢和免疫信号传导。通路相互作用分析表明,这些生物学过程在功能上是相关的(图4c)
a. 基因集的转录组ITH,包括癌症标志基因集(n = 50)和来自KEGG (n = 186)和Reactome (n = 674)途径数据库的基因集。b,选自a和补充图20的六个途径的代表性小提琴图,显示与患者生存率显着相关。细胞数:胃粘膜细胞,n = 5,937。胃腔细胞,n = 12,341;胰腺导管细胞,n = 1037;胆囊粘膜细胞,n = 285。十二指肠上皮细胞,n = 366。结直肠上皮细胞,n = 5,278;长期幸存者,n = 18,428;短期幸存者,n = 6,816。c,a中显示的差异表达途径的相互作用网络。d,小提琴图显示了在多个验证队列中,以胃为主的组和与GI混合的组之间免疫细胞组成的差异。
胃来源的肿瘤细胞中大量富集与较短生存期相关的途径,包括细胞周期,DNA修复,PI3K / AKT / mTOR,mTORC1,Wnt,NF-κB和代谢重编程,这些都是致癌的。富含结直肠样肿瘤细胞与更长生存期相关的途径,包括防御素,IL-7信号传导,补体级联,IL6 / JAK / STAT3信号传导和干扰素α/γ,它们都是与免疫相关的(图4a,b )。这些结果表明,具有不同谱系或转录组状态的肿瘤细胞可能参与了不同的生物学过程,从而导致了它们独特的分子后果和患者生存。
肿瘤免疫微环境的细胞组成表明,在具有GI混合特征的肿瘤中,B细胞的丰度得分显著提高(与具有胃主导性特征的肿瘤相比)。在具有胃肠道混合特征的肿瘤中,M1类巨噬细胞(促炎性)的比例更高,M2类巨噬细胞(抗炎性)的比例更低。与癌症相关的成纤维细胞的丰度得分也存在显着差异,在具有胃肠道混合特征的肿瘤中较低。总之,分析表明具有胃肠道混合特征的肿瘤在免疫学上更具活性。
肿瘤细胞谱系组成的单细胞分析将PC病例分为两个具有明显生存差异的亚型
根据肿瘤细胞谱系组成,我们将PC样本分为两种主要的亚型:胃优势型(主要是胃细胞谱系)和胃肠道混合型(混合了胃和结肠直肠样细胞)(图1c)。这两个亚型之间的组织病理学特征上未观察到显着差异。GAC-PC验证数据中以胃为主的组的17q gain非常多;PC基于起源细胞的分类显示出与患者生存密切相关(图1c):GI混合表型的所有6例都是长期存活者,而胃主导型的8例中有6例是短期存活者(Fisher精确检验,P = 0.0097,对数秩P = 0.05;图5a)。这些结果表明,PC肿瘤细胞的转录组特征可以预后患者的生存。
a,发现的GAC-PC队列的生存分析。b,描述生成12个基因签名的生物信息学流程的图示(详见方法)。c,在胃占优势的群体和GI混合的群体之间的12个签名基因的差异表达。d,GAC-PC患者的第二个独立队列的生存分析(n = 45)。e–h,在三个额外的本地GAC大规模验证队列中对12个基因标记进行的生存分析。
12个基因的预后特征的产生和验证
接下来试图产生可能实用的基因表达特征。对胃主导型和GI混合型亚型的PC肿瘤细胞进行了单细胞DEG分析,然后识别最重要的DEG,并根据与患者生存和测试的统计相关性筛选每个DEG 基因组合(图5b)。经过多步处理后,获得了12个代表基因(图5c)。
在一个独立的GAC-PC队列(n = 45)中验证了这一特征。对于每个肿瘤样本,使用RNA-seq数据计算得分,并据此将样本分为胃主导组或GI混合组进行后续分析(补充图24,见方法)。显示出预后准确性,以胃为主的PC患者生存时间明显短于胃肠道混合组患者(7.8 vs 24.5个月)(图5d,左)。多元Cox回归分析表明,该信号是短生存的有力预后因素,危险比为12.7(95%置信区间,3.2-51.0,P = 3.3×10-4;图5d,右), 独立于临床/组织病理学变量(补充图22)。
他们还评估了其他4个大规模局部GAC队列的预后意义19,26,27,28,总计1,336例患者在所有四个本地化GAC验证队列中仍具有预后意义(图5e-h和扩展数据图8a)。进一步强调了这种预后标记的价值及其在预后患者生存中的稳健性。