Cancers 6 |单细胞测序泛癌分析

实体瘤肿瘤特异性免疫预后特征及其与免疫检查点治疗的关系
首先让我们通过摘要了解下这篇文章的主要内容,为了阐明免疫细胞浸润作为实体肿瘤预后标志的作用,作者分析了四个公开的单细胞RNA-Seq数据集和TCGA中的20个肿瘤RNA-Seq数据集的免疫功能相关基因。对泛癌转录组特征的无监督聚类显示出两种主要的免疫功能类型:一种与NK细胞,T细胞和B细胞功能有关,另一种与单核细胞,巨噬细胞,树突状细胞和Toll样受体功能有关。Kaplan–Meier分析显示这两组患者的预后不同,具体取决于癌症类型。接下来作者用弹性网络模型对TCGA实体瘤进行分析,发现155个基因与不同肿瘤类型的无病生存率相关,不同肿瘤类型的影响不同。利用这个基因集,作者计算了预测无病生存率和总体生存率的癌症特异性预后免疫评分模型。该模型在已发表的五种癌症类型的免疫检查点阻断治疗数据上的验证证实了癌症特异性较高的免疫评分与免疫治疗的反应相关。该研究提供了与免疫治疗反应相关的癌症特异性免疫相关预后基因组的全面图谱。
一.材料和方法
1.1数据来源和预处理
使用公开可用的五种肿瘤类型的scRNA-Seq数据。从TCGA中收集20种肿瘤类型的大量RNA-seq数据。其中scRNA-seq数据包括:GSE72056:19个黑色素瘤患者样本(4645个细胞)的scRNA-Seq数据;GSE75688:11个乳腺癌患者样本(549个细胞)的scRNA-Seq数据;GSE84465:4个胶质母细胞瘤患者样本(3589个细胞)的scRNA-Seq数据;GSE103322:18例头颈癌患者样本(5901个细胞)的scRNA-Seq数据;GSE81861:11位大肠癌患者样本(375个细胞)的scRNA-Seq数据。应用t-SNE法进行细胞类型的聚类。从cBioPortal中收集了相应的患者临床信息,其中包含有关总体和无病生存信息的随访数据。从已发表的文献中收集了用抗PD1 / PDL1治疗的黑色素瘤,膀胱尿路上皮癌,肾细胞癌,胃癌和非小细胞肺癌肿瘤的患者转录组学和临床数据。使用EdgeR对所有转录组数据进行数据标准化。
1.2计算分析与数据处理
从四个公开的资源中整理了免疫功能的signature:CIBERSORT中使用的LM22免疫浸润signature,LM7免疫浸润signature,实体肿瘤免疫浸润的ImSig signature和NanoString免疫signature。将来自这些资源的61个基因集组合在一起,进行单样本基因集富集分析(ssGSEA),使用R包GSVA对scRNA-Seq和RNA-Seq肿瘤数据集进行了分析。使用Spearman相关系数作为相似性度量,对肿瘤(RNA Seq)或单个细胞(scRNA Seq)进行无监督的ssGSEA评分聚类。应用Kaplan-Meier以及Cox比例风险模型来评估多变量生存率。采用双侧Wilcoxon检验计算免疫治疗数据集中治疗反应组之间免疫评分差异的p值。
1.3癌症特异性免疫分数的计算
使用RNA-Seq转录组数据计算了20种TCGA肿瘤类型的癌症特异性免疫评分。具体分为以下几步:
首先,针对每种癌症类型,计算了61个免疫基因集的单样本富集度。然后,对每种癌症类型的样本进行Kaplan-Meier分析,将样本分成61种免疫功能的高或低富集度。使用包含具有明显较好或较差无病生存期的免疫基因集的基因来查找可预测该癌症类型中无病生存期的最小基因集。接下来,在这组基因上使用弹性网模型来预测短期存活与长期存活患者之间的关系。其中70%的癌症样本用于训练弹性网模型,30%用于训练。选择模型中系数非零的基因作为肿瘤类型特异性免疫标志物的候选基因。接下来进行了基因水平的Kaplan-Meier分析选择与生存率显著相关的基因作为该癌症类型的最终免疫评分模型。最后,通过在最后一步中确定的基因表达的加权总和来计算癌症特异性免疫评分,相应的弹性网系数为权重。
二.结果展示
2.1对肿瘤scRNA序列数据的分析确定了具有明显免疫特征的主要簇
图1显示了黑色素瘤肿瘤样本的scRNA-Seq数据的ssGSEA识别了三个主要的与免疫功能相关的细胞簇。作者首先通过无监督的t-SNE聚类识别出14个细胞簇。使用ssGSEA将这些簇分为三组不同的免疫功能。一组与单核细胞、巨噬细胞、树突状细胞和Toll样受体(TLR)有关;一组与b细胞功能有关;另一组与NK和T细胞功能有关。接下来作者计算了在无监督的t-SNE分析确定的细胞簇中,分配给特定免疫功能的细胞比例。发现细胞簇0、1、5、6和12富集NK细胞和T细胞功能;细胞簇2和14富集了B细胞功能;细胞簇7、9和10丰富了与单核细胞,巨噬细胞和树突状细胞有关的功能。
图1. 黑色素瘤肿瘤样本的scRNA-Seq数据的ssGSEA识别了三个主要的与免疫功能相关的细胞簇
2.2肿瘤RNA-Seq数据的泛癌分析确定了与预后相关的两个主要免疫簇
在这一部分,作者对来自TCGA的20种实体肿瘤的bulk RNA-Seq数据进行了相同的分析。作者对8457个肿瘤样本进行了无监督的聚类分析,其中23个免疫基因集的ssGSEA评分在不同肿瘤样本间差异较大。确定了两个主要的免疫功能簇:一个具有较高的NK细胞,T细胞和B细胞功能富集(免疫簇1),另一个具有MoMaDC,小胶质细胞和Toll-受体(TLR)的功能(免疫簇2,图2)。为了观察这两种不同的免疫功能簇是否与20种癌症类型的患者预后差异相关,作者对TCGA患者样本进行了无病生存率和总生存率的Kaplan–Meier分析。发现,对于GBM,LGG,OV,BLCA,PAAD和BRCA免疫簇1表现出更好的无病生存期或总体生存率。相反,对于KIRC,KIRP,UCEC,UVM和SKCM免疫簇2显示出更好的无病生存期或总体生存率。该结果表明不同肿瘤类型的预后免疫特征不同。
图2. 20种TCGA肿瘤类型的RNA-Seq数据的ssGSEA分析
2.3癌症特异性免疫基因的分析
作者接下来想要得出癌症特异的预后免疫特征。作者感兴趣的是找到一组最小的与免疫功能相关的基因,这些基因仍然可以预测个体癌症的预后。作者从免疫功能相关的基因集中收集了1351个基因。接下来使用基于弹性网络模型找出每种癌症类型中预测预后标志物的最小基因子集。对入围的基因进行Kaplan-Meier分析,只选择那些与该癌症类型的无病生存率显著相关的基因,最终获得了155个与不同肿瘤类型预后相关的基因。图3显示了在20种TCGA肿瘤类型中所有155个基因的图谱及其与预后的关系(红色为正相关,蓝色为负相关)。对20种癌型肿瘤样本中这155个基因的表达进行聚类后将这些基因聚成了两个簇。最后作者对与更好的预后相关的基因和与不良预后相关的基因分别进行了基因的富集分析。结果显示在一种以上癌症类型中与不良预后相关的基因富集了细胞周期功能。相反,发现仅与良好预后相关的基因富集了干扰素信号传导功能。
图3
2.4癌症特异性预后免疫评分模型预测20种癌症的无病生存率和总生存率
为了获得综合免疫评分,计算了最终选定基因的表达总和并通过它们各自的弹性网系数加权。图4显示了该模型的流程图。然后作者将该模型应用于GBM中进行验证。首先通过弹性网选择了31个与免疫功能相关的基因,然后通过Kaplan–Meier分析,最终选择了13个与GBM患者无病生存显著相关的基因。由这13个基因计算的免疫评分将TCGA GBM患者分为DFS和OS的更好或更差的预后组。多变量Cox回归分析显示免疫评分与年龄和MGMT甲基化状态是GBM队列中DFS的独立预测因子。来自REMBRANDT的独立验证队列中,使用13个预后基因的GBM免疫评分模型将患者分为更好或更差的预后组。
图4
 
2.5癌症特异性免疫评分模型预测免疫检查点抑制剂治疗的反应
由于癌症特异性免疫评分可以成功预测不同类型癌症患者的生存率,因此作者试图检查它们是否也可以预测对免疫疗法的反应(图5)。结果发现在已发表的抗PD1/抗PDL1治疗肿瘤的数据集中,反应性肿瘤(CR/PR)患者的癌症特异性免疫评分高于无反应性肿瘤患者(SD/PD)。最后作者通过ROC曲线来评估该模型预测的准确性,结果显示在不同肿瘤类型的已公开数据集中,免疫评分可预测抗PD1 /抗PDL1免疫疗法的客观反应。
图5
好啦,这篇文章的内容就这么多啦~ 总之,该研究表明针对不同癌症类型的免疫特征对患者的预后有重要意义,它还可作为计算20种癌症类型的癌症特异性免疫评分的框架。
(0)

相关推荐