IF=6.574|肝癌代谢亚型分类新思路
导语
今天和大家分享的是2020年4月份发表在Mol Oncol杂志上的一篇文章“Metabolism-associated molecular classification of hepatocellular carcinoma”(IF=6.574)。文章中作者整合TCGA和ICGC共602个人体样本,通过非负矩阵分解(NMF)聚类,确定了HCC的3个亚型(C1、C2和C3),生成了一个90个基因分类器来进行肝癌分类器,建立了一个新的肝癌分类。
Metabolism-associated molecular classification of hepatocellular carcinoma
肝细胞癌的代谢相关分子分型
一、研究背景
肝细胞癌(Hepatocellular carcinoma,HCC)是一种高度治疗复杂性的疾病,显示出很高的分子表型异质性。肝癌的基因表达模式通常分为两个亚型,增殖性HCC和非增殖性HCC。增殖性肝癌可通过激活TGF-β,MET,AKT和/或IGF2途径表现出特定亚型特征。相比之下,非增殖性肝癌通常分化良好,侵袭性较低,并且血清α-甲胎蛋白(AFP)水平较低,TP53突变且预后较好,他们倾向于保留正常肝中沿肝门中心轴分布新陈代谢功能的分区程序。增生性肝癌和非增生性肝癌之间的代谢区别表明,从代谢的角度对肝癌进行分类具有较好的区分效应。
二、研究思路
三、结果解读
1、NMF识别HCC中的三个亚类
表1:TCGA,ICGC和GEO组的临床特征
不同队列的患者的临床特征见表格1,作者选择了先前报道的2752个与代谢相关的基因作为NMF分析的基础。筛选后,共鉴定出816个候选基因,并使用NMF共识聚类法根据上述816个候选基因的表达谱对包含TCGA和LIRI-JP的602个HCC样本的元数据集进行聚类。计算态相关系数以确定最佳k值, 综合考虑后最终选择k = 3作为最佳聚类数。
图1.三个子类C1,C2和C3
当k = 3时,共识矩阵热图仍保持清晰的边界,表明样本的聚类稳定且稳健。为了验证亚型的分配,通过t-SNE来减小特征的维数,发现亚型型名称在很大程度上与二维t-SNE分布模式一致。随后对来自GEO数据库的221个HCC样本的数据集进行了另一项独立分析,揭示了肝癌有三个不同的分子亚型。
图2.TCGA队列中NMF聚类共识矩阵
然后进行SubMap分析以确定在上述两个数据集中标识的亚型是否相关,结果表明数据集中的C1,C2和C3亚型与文献中的亚型高度相关,表明存在三种具有不同基因表达模式的HCC分子亚型。
图3.独立数据集HCC分类的相关性
使用前面提到的k=3分类,在数据集中观察到显着的预后差异,与 C2相比,C1和C3更长的中位生存时间。独立的TCGA和LIRI队列也显示了相同的结果。此外,GSE14520验证了预后差异队列(221名具有可用生存信息的患者)也观察到相似的差异,C1的OS时间明显长于C3和C2的OS时间,而RFS则未观察到显着差异。
图4.三个亚类(C1,C2和C3)的OS和RFS
2、肝癌亚类的相关转录组
对三个HCC亚型进行了差异分析,共鉴定出2830个亚型特异性签名基因,其中C1共509个特异性基因,C2共2042个特异性基因和C3共279个特异性基因。使用clusterprofiler程序包对签名基因进行基因肿瘤学富集分析。许多代谢相关的生物过程都显着丰富了C1的特征基因,而C2的特征基因则观察到了丰富的细胞外基质(ECM)相关过程。此外,GSEA被用于鉴定每个亚型中富集的途径,对亚型特异性基因的途径分析结果表明,氨基酸代谢相关途径对C1显着富集,ECM相关途径对C2富集,而C3显着丰富了包括激素和蛋白聚糖代谢在内的相关通路。
图5.亚类特异性基因的基因集富集分析结果
3、肝癌亚类与代谢相关特征的相关性
考虑到分类是基于与代谢相关的基因,进一步探讨了不同的亚型是否具有不同的代谢特征。首先,使用GSVA R软件包对115个新陈代谢过程进行了量化,然后进行差异分析以发现特定于亚型的新陈代谢特征,其定义为在相应亚型中具有较高GSVA评分的特征。结果表明,根据差异分析的结果,只有C1和C3具有特定的代谢特征,而C2没有特定的代谢特征。值得注意的是,C1的39种特定代谢特征中有13种与氨基酸代谢有关,包括尿素循环,这与先前报道的门静脉(PP)型HCC的代谢模式相似,涉及糖异生,氨基酸分解代谢和尿素的基因特征。
图6.代谢特征与HCC亚型之间的关联
为进一步研究亚型的特征,使用GSVA算法选择并量化了七个HCC相关特征。C1的PP和静脉(PV)签名明显高于C2和C3,C2的基质相关验证表达更高,这与富集分析的结果一致。与C2和C3相比,C1的茎干相关特征明显低于分化相关的特征评分,这与C1的临床特征相对应。此外C1和C3均具有比C2高得多的Wnt激活相关得分,这可能与它们携带钙粘蛋白相关蛋白beta 1(CTNNB1)突变的频率较高有关。然后使用ESTIMATE算法来计算免疫和基质评分。三组之间的免疫评分存在显着差异,C2的免疫评分高于C1和C3。此外,C3的基质评分低于C1和C2。
4、HCC子类与元数据集中免疫浸润的相关性
由于亚型间的免疫评分存在显着差异,因此对免疫浸润进行了研究以表征其免疫学特征。使用MCP计数器和ssGSEA算法计算了16种与免疫相关的细胞类型的丰度,并在热图中进行了展示。在C2和其他两个亚型之间观察到显着差异,其中11个免疫细胞群与C2、C1或C3相比较的丰度更高。另外,C2对Treg细胞和Th17细胞也显示出较低的富集。值得注意的是,C2中的基质细胞群(内皮细胞和成纤维细胞)明显更高,这与先前C2富集基质相关特征的结果一致。
图7.数据集中三个子类的免疫特性
进一步研究亚型与15种潜在可靶向免疫检查点基因表达之间的关联,这些基因是根据临床试验中的当前药物抑制剂选择的,或者已被批准用于特定癌症类型,结果表明C2在14个免疫检查点中表现出更高的表达(LAG3除外)。
5、CGA和GEO数据集中HCC亚型与临床特征的相关性
基于TCGA和GEO队列,卡方检验的结果显示TCGA队列中临床病理特征与HCC亚型之间存在显着相关性。血管浸润,病理I / II期,组织学分级G1 / G2和血清AFP水平低与C1亚型相关;血管浸润,病理晚期(III / IV),组织学分级(G3 / G4)和高血清AFP水平与C2或C3亚型相关。同样,在GEO队列中,C1与低转移标志,低血清AFP水平和病理I / II期相关。
图8 .TCGA和HCC中HCC亚类的临床特征
6、HCC亚类与突变,新抗原体和拷贝数变异的相关性
为研究HCC亚型的体细胞突变频率是否存在差异,并观察HCC亚型之间不同突变模式,分析了来自TCGA和ICGC数据库的体细胞突变数据。图9显示了具有高突变频率或处于关键途径(包括P53 /细胞周期途径,Wnt /β-catenin途径和肝分化)的基因。结果表明,C1和C2表现出明显的突变特征。具体而言,C1的TP53突变频率(16%)明显低于C2(30%)和C3(25%),而C2的CTNNB1(3%)突变频率显着低于C1(26%)和C3(35%)。
图9. HCC亚类与突变,新抗原体和拷贝数变异的关联
将分类与总突变数和预测的新抗原相关联,观察到突变数量上的显着差异,与 C1和C3相比,C2的突变中位数更小。在成对比较中,未发现新抗原数量的统计学差异。先前的研究表明,染色体11q13上的HCC驱动基因(例如FGF19)具有更高的扩增可能性。这些基因可能在肝癌的治疗中发挥关键作用。因此接下来研究了HCC分类与11q13号染色体上驱动基因扩增之间的相关性。尽管在成对的亚型之间未观察到驱动基因扩增的显着差异,但C2仍显示出比C1和C3高的扩增比例(例如FGF19:9.09%)。
7、90基因分类器和性能验证
差异分析结果显示,C1亚型有509个关键基因,C2亚型共2042个,C3亚型共279个关键基因。在综合考虑准确性和临床应用潜力之后,选择每个亚型中log2FC值最大(> 0)的前30个基因用于亚型分类的开发。因此,生成了一个90基因分类器,并将其可视化。随后使用90基因分类器在GSE14520数据集中重复了亚型预测。评估了与基于NMF的原始预测的一致性,我们观察到C1亚型的一致性为76.35%,C2亚型的一致性为85.56%,C3亚型的一致性为70.59%。结果表明,具有90个基因的特征可重复地确定HCC分类。
图10.鉴定预测分类器和推定的靶向治疗和免疫治疗反应
8、HCC亚类对免疫疗法和靶向疗法有不同的敏感性
在HCC亚型中,不同的免疫浸润模式和免疫检查点基因的表达水平表明,应对免疫疗法的可能性有待进一步研究。将三种HCC亚型(C1,C2和C3)的表达谱与另一个已发布的数据集进行了比较,该数据集包含47位接受了程序性细胞死亡蛋白-1(PD-1)免疫检查点抑制剂或细胞毒性T-抑制剂的黑色素瘤患者淋巴细胞相关蛋白4(CTLA-4)免疫检查点抑制剂(图10C)。比较C2组和CTLA4反应组的表达谱时,存在显着相关性(P = 0.01),这表明C2组的患者对抗CTLA4治疗的反应更有希望。此外还使用相同的方法探索了HCC亚型对靶向药物(索拉非尼和卡博替尼)的敏感性之间的关联。对于卡博替尼,C2与卡博替尼敏感组显着相关,而C1与卡博替尼耐药组显着相关。对于索拉非尼,仅在C2组和索拉非尼耐药组之间观察到相关性。
四、小结
本研究从代谢的角度对肝癌进行了分类,对来自TCGA和ICGC共602个样本进行综合分析,将2752个先前表征的代谢相关基因的测序数据用于非负矩阵分解聚类,鉴定出HCC的三个亚型(C1,C2和C3),并分析了数据集的代谢特征,预后价值,转录组特征,免疫浸润,临床特征和亚型的药物敏感性,这个分类模型有助于预测HCC患者的预后和前瞻性免疫治疗疗法。