又是一篇4+分免疫亚型...别撞车了...
Identification of immune subtypes and prognosis of hepatocellular carcinoma based on immune checkpoint gene expression profile基于免疫检查点基因表达谱的肝癌免疫亚型的鉴定和预后
一、 研究背景
目前,免疫检查点阻断疗法已应用于肝细胞癌治疗。但是肝细胞癌是一种多因素疾病,受遗传和环境因素共同影响。肿瘤细胞中了发生多个基因组缺失,这导致了免疫检查点治疗的局限性。因此,有必要进一步区分肿瘤免疫亚型以改善临床试验设计,并确定可能受益于免疫检查点治疗的患者。而在现有研究中有许多关于单一免疫检查点抑制剂的文献,缺乏基于多个免疫检查点基因表达谱的研究。
二、 分析流程
三、 结果解读
1. ICGs表达及预后分析
因为每个样本RNA可能有不同长度,测序深度也可能不一样,所以需要对测序数据标准化。作者对每个数据集进行了预处理,如删除了无临床信息或OS <30天的样本,删除正常组织样本等。预处理后的TCGA样本数量为342,GSE14520样本数量为220。最后作者用FPKM(先将测序深度标准化,再将基因长度的标准化)衡量两个不同样本中同一个基因的相对表达量。在TCGA数据库中能找到47个ICG其中45个的表达水平,高表达组(红色)以CD40,CD276,TNFRSF14和NRP1为代表。低表达基团(蓝色)以CTLA4和CD274为代表。中等表达组(绿色)以IDO1,PDCD1和LAG3为代表,但表达水平在不同样品之间差异很大。
图1. TCGA数据集中ICG表达的热图
通过单因素Cox回归,作者分析了预后与45种ICG的关系,其中有8个ICG与预后显著相关。右图是ICG表达水平的相关性分析,表明了它们主要呈正相关。此外存在着明显的聚集效应,表明ICG之间的协同表达关系。
图2. ICGs表达与预后的关系、ICG表达水平的相关性
接着,作者进一步分析了GSE14520数据集的35个ICG,三个表达组中的基因与TCGA分组的基因高度一致。但是,PDCD1(PD1)在TCGA中定义为中等表达水平,而在GEO数据集中定义为低表达水平。可能是因为PDCD1的表达水平较低,并且样品之间差异很大。同样地,通过单变量Cox回归分析了ICG与OS之间的关系,发现了另外8个ICG与OS预后之间存在显著相关性(图3.B)。在TCGA和GSE14520数据集中,NRP1基因都与不良预后显著相关(HR> 1,log-rank p <0.05)。此外,与TCGA结果一致,ICG表达水平在GSE14520数据集上也呈正相关,存在显着的聚集效应(图3.C)。
图3. GEO数据集的ICG分析
2.ICG与其他免疫检查点治疗生物标志物之间的关系
根据TCGA的体细胞突变数据,删除了内含子区域和无突变区域后,作者计算了HCC的肿瘤突变负荷(TMB)。因为TMB的分布不满足正态分布(Shapiro.test p <1e-5),所以使用spearman方法评估了TMB与8种与OS预后密切相关的ICG之间的相关性。在TMB和NRP1的表达之间观察到显著的负相关(图4,R2 <-0.2,FDR <0.001),即说明在TCGA患者中高表达的与预后不良有关的基因NRP1,对应低水平的TMB,因此NRP1高表达的患者不适合使用PD1抑制剂治疗。
图4. ICG和TMB表达水平的散点图
因为出现肿瘤体细胞突变后,会产生错误的蛋白质(新抗原),可通过MHC I呈递,与TCR结合后能诱导抗肿瘤适应性免疫反应,所以这一步分析与TMB的分析相互验证。作者根据TCGA的体细胞突变数据进一步分析了新抗原与ICG表达之间的关系,在NRP1基因和新抗原之间也发现了显著的相关性(FDR <0.05),这与前面提到的TMB和NRP1的表达之间的显著负相关是一致的。(图5)
图5. ICGs表达水平和新抗原的散点图
3.ICG与适应性免疫抵抗途径基因之间的关系
上一步分析得到了ICG与TMB,新抗原负荷呈负相关,即高ICG对于低TMB,而低TMB有利于诱导免疫耐受,所以作者想进一步探索ICG与免疫抵抗途径基因之间的关系,从表型过渡到基因间的调控关系。
CD8+T细胞可产生IFNγ,导致适应性免疫抵抗途径基因(包括PD-1 / PD-L1 axis和IDO1)上调。因为PD1/PDL1、IDO1已经作为TCGA中的ICG被分析,所以这一步分析了与 PD-1/PD-L1 和IDO1具有正相关的基因(CD8A,CD68,GZMB,NOS2)和ICGs之间的相关性,这里的CD8A是CD8+T细胞的标记,CD68是巨噬细胞或其他单核细胞谱系的标志,GZMB是CD8+T细胞中细胞溶解活性的标志,NOS2是M1巨噬细胞的标志。结果显示,在适应性免疫抵抗途径中的CD8A,GZMB和CD68基因与ICG的表达呈显著的正相关(B图是对相关系数显著性检验的结果)。因此,适应性免疫途径的基因可能在ICG的表达中起一定的调节作用。
图6. TCGA中ICG与适应性免疫抵抗途径基因相关性的热图(A)、及相关系数p值(B)。
作者使用GSE14520数据进行了验证,适应性免疫抵抗途径基因与ICGs表达也呈正相关。此外,CD8A与LAG3,CD86,ICOS和CD27呈显著正相关,这与TCGA数据集的结果一致。
补充图 S1. GEO数据集中ICG与适应性免疫抵抗途径基因相关性的热图(A)、及相关系数p值(B)。
4.ICG与临床特征之间的关系
作者接着分析了8个关键基因与TCGA的临床特征之间的关系。由于HCC的N和M期样本的数量分布差异很大(N0/N1:238/3,M0/M1:244/3),所以只分析了这8个ICG在T期,Grade,Stage的表达差异。8个ICG被分为5个高表达组和3个低表达组。NRP1和CD276基因的表达在T,Grade,Stage上有显著性差异(Kruskal-Wallis检验,p <0.05),高表达组的5个基因早期肿瘤样品的表达水平低于晚期的表达水平(图7A-C),结合上面的结果,可以认为在晚期患者中更容易诱导免疫耐受。
图7.ICG与临床特征关系的箱型图
5.ICG定义亚型与预后之间的关系
PD1(PDCD1),PD-L1(CD274)和IDO1是已知的免疫检查点的重要基因和免疫疗法的重要生物标志物。然而,前面的单变量生存分析未能观察到与OS的任何显著的预后关系,为了使结果更有临床指导意义,作者进一步建立与CD274、IDO1相关的免疫亚型。
这里要注意的是,作者发现即使已有分析表明PD-L1,IDO1和CD8A表达之间存在显著的正相关,但是有些患者却出现CD8A表达而对应的PD-L1表达缺失/无表达的情况。而CTLA4已经在GEO数据集验证了与预后显著相关。因此,除了上面提到的基因,另外加上了CD8A、CTLA4一起建立免疫亚型。另外,前面已经筛选出NRP1这个关键基因了,作者没有选择它一起构建免疫亚型可能是因为效果并不理想。
选定构成免疫亚型的基因后,作者根据IDO1,CD274,CTLA4和CD8A的FPKM分布,以第一主分布区间的偏差为阈值(即红色虚线)将患者分为高表达组和低表达组。(补充图 S4) 在下一步进行预后分析时,如果直接将四个基因放在一起分组,将有15个分组(四个基因全部高表达,三个基因高表达,两个基因高表达,一个基因高表达,四个基因全部低表达),比较起来十分不便。所以作者根据与其他三个基因相关性比较好的CD8A(补充图7),一共构建了IDO1/CD8A、CD274/CD8A、CTLA4/CD8A三对比较。
补充图 S4. TCGA中IDO1、CD274、CTLA4、CD8A基因表达水平的密度分布
补充图7.A-C TCGA中CD8A与IDO1/CD274/CTLA4相关性分析
对三对基因样本的生存分析表明,样本之间的OS预后存在显著差异。CD8A高表达,IDO1,CD274和CTLA4低表达的组预后最好。CD8A低表达,IDO1,CD274和CTLA4低表达的组预后最差(图8. A-C)。得到最佳和最差预后的两组结果后,为了让结果更清晰,作者从A-C图提取出相关的曲线绘制了图8. D-F。随后,CD8A高表达,IDO1和CTLA4低表达的预后在GSE14520数据集得到了验证(补充图8)。
图8. TCGA中各种免疫亚型的生存曲线
补充图8. GSE14520中CD8A高表达、IDO1、CTLA4低表达组的预后
小结
本篇文章中通过TCGA和GEO肝癌样本中免疫检查点基因的表达信息,分析了它们与预后,其他免疫检查点生物标志物,适应性免疫途径基因之间的相关性。鉴定HCC免疫亚型之间的预后差异,为肝细胞癌患者的个体化治疗提供了基础,也为免疫检查点的药物设计提供了新思路。
值得注意的是,在获得了八个关键ICG后,作者还考虑到已知的免疫检查点抑制剂疗法的重要生物标志物,确定了PD-L1,IDO1,CTLA4和CD8A表达水平的整合可能是评估肝细胞癌患者免疫状况并探索预后信息的更好方法。