公开数据单细胞挖掘6+分思路
Cancer-Specific Immune Prognostic Signature in Solid Tumors and Its Relation to Immune Checkpoint Therapies实体瘤中癌症特异性免疫预后特征及其与免疫检查点治疗的关系
一、 研究背景
免疫疗法作为多种癌症的治疗方法受到了广泛关注,然而尽管免疫检查点抑制剂疗法具有巨大潜力,但并非所有患者都有理想反应,这与患者的基因组特征,如肿瘤突变负荷,微卫星不稳定性和肿瘤微环境有关。肿瘤微环境涉及到各种免疫细胞类型的浸润,在不同类型的癌症中具有不同的成分,所以作者希望可以确定不同癌症类型中与患者预后相关的特定免疫特征。
二、 分析流程
三、 结果解读
1.肿瘤scRNA-Seq分析确定具有免疫特征的主要亚群
在单细胞水平上进行肿瘤转录组分析可以准确表征免疫细胞浸润,所以作者首先针对单细胞转录数据进行分析。作者在GEO数据集中获得了五种肿瘤类型(黑色素瘤GSE72056,乳腺癌GSE75688,胶质瘤GSE84465,头颈癌GSE103322和结直肠癌GSE81861)的scRNA-Seq数据,使用了Seurat包进行单细胞分析,对经过log转换的TPM值(transcript per million)进行t-SNE聚类(图1.a-黑色素瘤的细胞聚类)。接着,作者对四个已发表的针对免疫功能的signature中的61个基因(CIBERSORT的LM22免疫浸润signature;Tosolini研究的LM7免疫浸润signature;Nirmal研究的免疫浸润的ImSig signature;以及NanoString免疫panel(https://www.nanostring.com/))进行单样本基因集富集分析(ssGSEA)。
根据ssGSEA分数识别各细胞高度富集的免疫功能(图1.b),如果一个cluster超过70%的细胞具有某一个高度富集的免疫功能,则该cluster将被归类到该免疫功能中。对于黑色素瘤和乳腺癌,确定了三个免疫功能亚群(NK+T细胞、B细胞、混合细胞功能-嗜酸性粒细胞/中性粒细胞/趋化因子/细胞周期,单核/巨噬/树突状细胞MoMaDC)。图1.c显示了黑色素瘤中每个cluster里特定免疫功能的细胞比例。对于胶质母细胞瘤和头颈癌,因为B细胞功能的富集未形成显著的特征,所以只确定了两个主要的免疫功能亚群(NK+T+B细胞、混合细胞功能-中性粒细胞/细胞周期,单核/巨噬/树突状细胞MoMaDC)。对于结直肠癌,确定了四个主要的免疫功能亚群(NK+T细胞、B细胞、MoMaDC、无特殊特征)。
然后作者将以上注释结果与原始研究中的分子亚群注释对比,发现对NK/T-和B细胞群的功能注释具有较高的特异性和敏感性。对乳腺癌,胶质母细胞瘤,头颈癌和结直肠癌scRNA-Seq数据分析和细胞类型注释也是类似的(补充图1)。
图1.黑色素瘤scRNA-Seq的ssGSEA鉴定了三种主要的免疫功能相关细胞亚群
补充图1.四种实体瘤(乳腺癌、结肠癌、胶质母细胞瘤和头颈癌)scRNA-seq的ssGSEA识别出2-3种主要的免疫功能相关细胞亚群
2.bulk RNA-Seq数据的泛癌分析确定了两个与预后相关的主要免疫亚群
接下来,作者从cBioPortal中获得了TCGA的20种实体肿瘤的bulk RNA-Seq数据,并进行了与scRNA-Seq相同的分析。对8457个肿瘤样本的无监督聚类后,ssGSEA显示不同肿瘤的得分的差异很大。另外,确定了两个主要的免疫功能亚群:cluster 1具有较高的NK细胞,T细胞和B细胞功能富集,cluster 2具有较高的MoMaDC,小胶质细胞和Toll-类受体(TLR)功能富集(图2.a),该结果与先前对scRNA-Seq数据集的分析一致。
为了了解这两种cluster是否与20种癌症类型的患者预后相关,作者根据cluster分组进行了无病生存期和总体生存期的Kaplan-Meier分析。对于某些肿瘤类型(多形性胶质母细胞瘤GBM,脑低级别胶质瘤LGG,卵巢浆液性囊腺癌OV,膀胱尿路上皮癌BLCA,胰腺癌 PAAD和乳腺癌BRCA),cluster 1表现出更好的预后(图2.b)。相反,对于其他肿瘤类型(肾透明细胞癌KIRC,肾乳头状细胞癌KIRP,子宫内膜癌UCEC,葡萄膜黑色素瘤UVM和皮肤黑色素瘤 SKCM),cluster 2显示出更好的预后(图2.c)。这些结果表明,不同类型的肿瘤之间的预后免疫特征不同。
图2.20种TCGA肿瘤类型的bulk RNA-Seq数据的ssGSEA
3.癌症特异性免疫特征基因分析
在先前的分析中可以看出,预后预测因癌症类型和cluster类型而异,因此作者希望获得癌症特异性预后免疫标记,而不是泛癌免疫标记。作者首先使用弹性网络回归来筛选基因以预测无病生存期。然后为了进一步筛选,作者对每个基因进行Kaplan–Meier分析,仅选择了与该癌症类型预后显著相关的基因。通过选择,在20种肿瘤类型中,总共获得了155个与预后相关的基因。图3.a显示了这155个基因表达及其与预后的关系。一些基因(蓝色)与预后较差有关,而另一些基因(红色)与肿瘤预后良好有关。值得注意的是,预后不良相关基因在不同类型的肿瘤中有较多重叠,而与更好的预后相关的基因很少在肿瘤类型之间重叠。
为了检查所有肿瘤类型中筛选得到的基因的表达模式,作者对这些基因进行了分级聚类。在20种癌症的泛癌背景下,这155个基因的表达形成两个不同的亚群(图3.b)。与预后不良相关的免疫特征基因左侧以橙色标注,在红色cluster中过表达,而与良好预后相关的基因左侧以紫色标注,在青色cluster中过表达。对这两个cluster的KM分析显示,在大多数癌症类型中(LGG、SKCM、LUAD、KIRC,KIRP, KICH, PRAD, PAAD, LIHC, THCA, BLCA),红色cluster与预后差显著相关,这一结果在一定程度上说明肿瘤类型间普遍存在共同的不良预后特征。途径富集分析还表明,与不良预后相关的基因细胞周期功能中富集(图3.c)。相反,与良好预后相关的基因在干扰素信号传导和补体中富集(图3.d)。
图3. 使用弹性网络回归筛选的预测分子和途径富集分析
4.癌症特异性预后免疫评分模型可预测20种癌症的无病生存期和总生存期
接下来作者按选定的基因在弹性网络回归的加权系数,计算了免疫预后评分。图4.a展示了构建癌症特异性预后免疫评分模型的过程。图4.b-f以GBM中的癌症特异性免疫评分特征来验证了模型的实用性。图4.b显示了TCGA GBM队列中经过弹性网络选择、KM分析筛选得到的在GBM中与预后相关的13个基因的表达热图。从TCGA数据中,作者证实了这种免疫评分可以将GBM患者分为DFS(图4.c)和OS(图4.d)预后更好或更差的人群。此外,通过对TCGA GBM患者进行多变量Cox回归分析,作者发现该免疫评分是独立预后因素(图4.e)。接下来,作者在独立的患者队列中验证了模型,使用相同的公式计算了GBM患者在Repository of Molecular Brain Neoplasia Data (Rembrandt)(一个大型公共脑瘤数据库数据)中的13个基因标记的免疫评分。对REMBRANDT患者队列的总体生存率的分析表明,根据免疫评分,患者可以明显分为更好或更差的生存组(图4.f)。
图4. 免疫预后评分构建以及对GBM预后评分模型的验证
5.癌症特异性免疫评分模型可预测对免疫检查点抑制剂治疗的反应
由于作者得到的癌症特异性免疫评分可以成功预测不同类型癌症患者的预后,因此作者接下来评估了它们是否也可以预测对免疫疗法的反应。作者在已发表的文献中收集了十个公开的癌症患者数据集(抗PD1/PDL1治疗的黑色素瘤,膀胱尿路上皮癌,肾细胞癌,胃癌和非小细胞肺癌)。经过EdgeR包将所有转录组数据标准化后,分别计算了每种肿瘤的特异性免疫评分,与没有反应的稳定疾病(SD)和进行性疾病(PD)患者相比,具有完全反应(CR)或部分反应(PR)的患者具有更高的癌症特异性免疫评分(图5.a-e),并使用了ROC曲线来评估模型(图5.f)。
最后,作者验证了癌症特异性免疫评分模型(针对黑色素瘤,肾癌,膀胱癌,胃癌和非小细胞肺癌)的重要性,使用皮肤黑色素瘤SKCM特异性和肾透明细胞癌KIRC特异性免疫评分,去预测ImVigor临床试验数据集中抗PDL1治疗的膀胱癌的反应,结果显示这些非癌症特异性免疫评分在肿瘤反应(CR或PR)和肿瘤未反应(SD或PD)的患者之间没有显示出显著变化,这强调了癌症特异性免疫特征的重要性。
图5. 对免疫检查点抑制剂治疗的反应的预测
小结
本篇研究分析表明了每种不同的癌症类型均具有独特的具有预后意义的免疫特征,作者构建了癌症特异性的预后免疫评分,并验证了预后模型的准确性和预测免疫治疗反应的效用。整体研究思路与普通预后分析并无太大区别,只是scRNA-Seq可以更准确地在单细胞水平上表征实体瘤中的免疫浸润。