自噬只能做实验?这篇4+分文章教你做热门通路生信分析!

Prognostic implications of autophagy-associated gene signatures in non-small cell lung cancer

自噬相关基因在非小细胞肺癌中的预后意义

一、研究背景

肺癌是世界目前最普遍的癌症,其中85%为非小细胞肺癌。2012年统计的数据显示,每年全球有大约160万患者死于肺癌,约占癌症总致死数的19%,包括晚期诊断、耐药性、高复发率等多个因素导致了肺癌的不良预后。迄今为止,预后预测仍主要依靠组织病理学诊断和肿瘤分期系统。然而,这种传统方法不足以精确评估NSCLC患者的预后。因此,发现可靠的预后生物标志物显得十分重要。         自噬是通过降解聚集的蛋白质和受损的细胞器分解代谢细胞的生物学过程,是癌变过程中的双刃剑。在这篇文章中,作者通过筛选NSCLC中的自噬相关基因构建风险模型,结合临床病例特征构建列线图,评估了预后价值。

二、分析流程

三、结果解读

1、非小细胞肺癌预后生物标志物的构建
  • 作者在TCGA数据库选取了490个肺腺癌(LUAD)患者样本和488个鳞状细胞肺癌(LUSC)患者样本,并在GeneCards数据库中选取了148个自噬相关基因。

  • 对这148个基因进行了单变量Cox回归分析。共有25和11个基因分别与LUAD(图1A和1C)和LUSC(图1B和1D)的OS显著相关。

  • 图1:单变量Cox回归分析选择与肺癌生存相关的自噬基因

  • 对基因进行LASSO Cox回归分析并计算了回归系数。LUAD中每个基因的系数如图2A所示。虽然包括了22个基因,但是该模型获得了最佳性能(图2C)。对LUSC队列进行了类似的分析,最终得到了11个与OS显著相关的基因(图2B,2D)

图2:不同基因的LASSO Cox回归系数

  • 作者研究了这些风险相关基因在肺癌中的改变,以了解它们对肺癌致癌作用的影响。(图3) 频繁的遗传改变表明这些基因在肺癌的发展中起着至关重要的作用。

图3:上图和下图分别代表LUAD和LUSC中筛选基因的遗传改变

  • 根据每个基因的mRNA表达水平和风险系数计算出每位患者的风险评分,风险评分用于预测预后情况,以风险中位数作为cut-off,将患者分为高风险组和低风险组。绘制热图以显示高风险和低风险LUAD组中的基因表达谱(图4A),HR>1定义为风险基因,HR<1定义为保护基因。图4A显示:高风险组中的患者更有可能表达风险基因;相反,低风险组的患者倾向于表达保护性基因。相似的分析也应用于LUSC组中。(图4B)

  • 图4C、图4D分别显示了LUAD和LUSC患者的风险评分分布以及风险评分与生存时间之间的关系。

  • 单因素分析表明,LUAD组的风险评分与OS显著相关(HR=2.920, 95% CI=2.412-3.534, P<0.001(图4E));LUSC组的风险评分与OS显著相关(HR=1.103, 95% CI=1.066-1.142, P<0.001(图4F))

图4A-B:自噬相关基因表达谱的热图(A为LUAD,B为LUSC)

图4C-D:风险评分的分布以及患者的生存时间

图4E-F:单因素Cox回归分析的森林图可视化结果

  • 多因素Cox回归分析显示,风险评分是独立的预后指标(图5A、C) Kaplan-Meier曲线表明,低风险评分患者的生存时间明显长于高风险评分患者的生存时间(图5B、D)

  • 对于LUAD和LUSC,风险得分的曲线下面积(AUC)最高分别为0.744和0.684(图5E和5F)。由于LUAD的22个自噬相关基因在预测预后方面超过了LUSC中的基因,因此将其用于进一步分析。

    作者发现,分期和风险评分的组合可以提高LUAD(图5G)和LUSC(图5H)的预后准确性或风险评分。

图5A-D:多因素Cox回归分析与Kaplan-Meier分析(左为LUAD)

图5E-H:ROC曲线分析(同理,左图为LUAD组)

2、识别涉及的信号通路

为了得到与22个自噬相关基因相关的潜在信号通路,作者将它们用作baits,得到LUAD中的50个变化最频繁的邻居基因。

  • GO分析表明这些基因参与包括生物调控,应激反应,发育过程,细胞增殖等多个过程(图6A)并形成了紧密的交互网络(图6B)

  • KEGG分析显示,这72个基因主要与自噬,细胞凋亡,EGFR酪氨酸激酶抑制剂(TKI)抗性,泛素介导的蛋白水解,PI3K-Akt信号通路和VEGF信号通路相关(图6C)

图6:GO分析和KEGG分析的结果

GSEA分析表明,改变的基因在几种常见通路中富集。(图7)作者发现发现高风险组富集于细胞周期、p53信号通路、DNA复制、泛素介导的蛋白水解;低风险组富集于mTOR,VEGF和胰岛素信号通路。

图7:GSEA分析高危人群和低危人群之间差异表达的基因

3、在独立的肺癌队列中验证预后基因标志物

为了验证基因对预测预后情况的价值,作者从GEO数据库获取了不同的肺癌队列。在每个队列中,根据计算出的风险评分将患者分为低风险组和高风险组,并比较两组的OS。结果表明,22个自噬相关基因具有较高的预测价值。(图8为在 Okayama 和 Rousseaux cohorts队列中验证的情况)

图8

4、构建个性化的预后预测模型

作者结合22个自噬基因特征,年龄,性别,T,N,M和TNM阶段,构建了列线图来预测3年和5年OS的可能性。如图9A所示,为每个因素分配的分数与其对生存的风险贡献成正比。校准曲线表明,实际和预测的存活率非常匹配(图9B和9C),尤其是5年存活率。列线图已在GSE30219肺癌队列中得到验证,并且3年和5年校准曲线分别显示在图9D和图9E中。

图9A:构建的列线图

图9B-E:校准曲线对预测结果进行验证

小结

这篇文章中,作者从TCGA和GEO数据库中获取数据集,通过单因素Cox分析筛选出LUAD和LUSC中的自噬相关基因,借助于LASSO分析建立最佳风险模型。随后作者在几个独立的GEO肺癌人群中进行验证,根据中位风险评分将患者分为高风险组和低风险组,进行生存分析以评估风险评分的预后价值。作者还探索了高危和低危人群之间关键信号通路的差异。最后,作者构建了列线图,通过整合临床特征和预后基因特征来预测个体的存活概率。

(0)

相关推荐