生信分析需要多维度的验证:多数据集和湿实验

今天给大家带来的是2019年12月发表在Aging(4.831)杂志上的文章“Development and validation of a nomogram with an autophagy-related gene signature for predicting survival in patients with glioblastoma ”。在这篇文章中,作者通过分析训练集TCGA-GBM和验证集CGGA,得到胶质母细胞瘤(GBM)预后相关的自噬基因,并构建了自噬相关的风险预后模型,还进行了GSEA分析以及基于独立的预后因素构建列线图。

Development and validation of a nomogram with an autophagy-related gene signature for predicting survival in patients with glioblastoma用于胶质母细胞瘤患者生存预测的自噬相关基因特征的列线图开发和验证

一.研究背景

  • 胶质母细胞瘤(GBM)是最常见的神经胶质瘤类型,其5年总生存率(OS)约为5%。治疗GBM的方法,包括手术、放疗、化学疗法、靶向治疗和免疫治疗。其预后因素包括年龄、切除范围、突变情况等

  • 自噬是一种基于溶酶体的降解过程,对分化、发育起重要作用。通过分解受损的蛋白质和细胞器,自噬可以抑制癌症的早期发展,从而减轻细胞损伤并限制染色体的不稳定性;但自噬还可以提供营养物质在低氧和低营养条件下促进肿瘤生长。

二.分析流程

三.结果解读

1.自噬相关基因(DE-ATG)的鉴定和富集分析
  • 图1A:使用edgeR分析TCGA-GBM数据集,设定 P < 0.01 以及 |fold change (FC)| > 1 为临界值,得到13625个差异表达基因DEGs

  • 图1B:将得到DEGs与自噬相关基因集ATGs取交集,得到72个DE-ATGs。

  • 图1C-F:对DE-ATGs进行GO分析与KEGG分析,在生物过程(BP)中,DE-ATGs在自噬、线粒体和自噬小体组装上富集;在细胞成分(CC)中,DEATGs在细胞质、细胞外囊泡、线粒体和自噬体膜富集;在分子功能(MF)中,DE-ATGs在ATP结合、蛋白质丝氨酸/苏氨酸激酶活性和半胱氨酸型内肽酶活性富;KEGG中,DE-ATGs主要在癌症通路、胰岛素信号通路和蛋白聚糖富集。

图1. DE-ATG的筛选和GO、KEGG分析

2.筛选预后相关的ATG
  • 单变量cox分析与多变量cox分析72个DE-ATGs与TCGA-GBM数据集的预后相关基因,最终得到3个预后相关DE-ATGs:NRG1、Alpha 3和MAP1LC3A。

  • 图2A-C:使用GEPIA数据集的GBM样品数据以及正常样品,验证上述3个预后相关DE-ATGs的表达差异,发现在GBM标本中ITGA3显著上调,而NRG1和MAP1LC3A显著下调。

  • 图2D-F:使用HPA数据集(人类蛋白质图谱)进行蛋白层面验证,MAP1LC3A在GBM组织呈阳性,而ITGA3和NRG1在GBM组织中呈弱阳性。

  • 图2G-I:构建生存曲线验证,发现ITGA3,NRG1和MAP1LC3A低表达组预后较好。

图2. 预后相关ATG的筛选与验证

3.构建(TCGA队列)并验证(2个CGGA队列)基于ATG的预后风险评分模型
  • 基于单变量cox分析得到3个预后相关DE-ATGs的回归系数β,并通过公式:风险评分= Gene1的表达×β1+ Gene2的表达×β2+…+ Genen的表达×βn;得到ATG的预后风险评分模型:风险评分= NRG1表达×0.132 + ITGA3表达×0.139 + MAP1LC3A表达×0.269。

  • 图3:基于中位风险评分将TCGA队列与CGGA队列的患者分为高风险组或低风险组,上图展示风险评分与生存时间的关系,中图展示ATG风险评分,下图展示NRG1、ITGA3和MAP1LC3A表达水平。

图3. 将TCGA队列与CGGA队列分成高、低风险组

  • 图4ACE:绘制三个队列高、低风险组的生存曲线,在6个月、1年和3年OS率上,低风险组均高于高风险组。

  • 图4BDF:绘制三个队列在6个月、1年和3年的AUC曲线,验证了ATG的预后风险评分模型。

图4. 验证ATG的预后风险评分模型

  • 表2:单变量cox分析和多变量cox分析三个队列影响预后的因素,发现自噬为独立的预后因素

表2. 单变量cox分析和多变量cox分析

4.GSEA分析
  • 图5:使用GSEA分析TCGA-GBM队列中ITGA3、MAP1LC3A和NRG1表达富集情况,发现高表达组DE-ATGs在自噬和癌症通路富集。自噬通路包括:自噬、MAPK信号通路、内吞作用和胰岛素信号通路;癌症通路包括:MAPK信号通路、mTOR信号通路和神经胶质瘤。

图5. GSEA分析

5.构建并验证列线图
  • 图6A:基于TCGA训练集的0.5、1和3年的OS率以及年龄、自噬、药物治疗、放疗和IDH状态构建列线图

  • 图6B-J:通过绘制TCGA队列与CGGA队列的0.5、1和3年的OS率的校准图来验证列线图,发现列线图与校准图基本一致,说明列线图预测效果良好

图6. 构建与验证列线图

小结

最后小结一下,作者使用TCGA-GBM数据集筛选出差异表达的自噬相关基因(DE-ATG)。对DE-ATG进行单因素和多因素Cox回归分析,以鉴定与预后相关的基因:NRG1、ITGA3和MAP1LC3A,进一步构建预后风险评分模型,并使用生存曲线和AUC曲线证明了该模型的预测预后的能力,然后还通过2个CGGA队列进行验证。随后,作者使用GSEA分析上述三个基因,并发现高表达组主要富集于癌症和自噬相关的KEGG通路。最后,作者构建了涵盖自噬、年龄、药物治疗、放疗和IDH突变状态在内的预后列线图,并且基于TCGA / CGGA的校准图验证了其预测性能。

(0)

相关推荐