太拼了!17个主图仅发3分+文章!

Identifcation of molecular markers associated with the progression and prognosis of endometrial cancer: a bioinformatic study子宫内膜癌中与病程进展和病人预后相关的分子标志物鉴定:生物信息学分析

一、背景介绍

子宫内膜癌(EC)是一种女性中常见的恶性肿瘤,死亡人数近20年成倍增长,一直缺乏有效的诊断和治疗方法。随着高通量测序技术的发展以及公开数据库的增多,通过综合分析各个数据,我们可以更准确的预测肿瘤发展,分析发病机制,为EC治疗提供方向。

二、分析流程

三、结果解读

1.DEGs鉴定与富集分析

作者鉴定了GSE17025与TCGA数据集中的DEGs,在GSE17025数据集中使用 “limma” 包以 p < 0.05,|log2fold change (FC)| ≥ 2为标准;TCGA 数据集中使用 edegr包以 FDR< 0.01 ,|log2fold change (FC)| ≥ 2为标准。TCGA中有1644个高表达,970个低表达基因;GSE17025中有101个高表达,147个低表达基因。然后做出韦恩图判断两数据集的重叠,2a结果显示两个数据集有84个共同高表达基因,2b结果显示两组有70个共同低表达基因。接着,作者对这些基因进行GO与KEGG富集分析,3a,c为GO功能富集分析结果,3b,d为KEGG富集结果,结果显示高表达基因在趋化因子活性,微管结合,趋化因子受体结合,RAGE受体结合,微管运动,微管蛋白结合活动中富集(3a),在IL-17通路中富集(3b);低表达基因在糖胺聚糖结合和胶原结合活动中富集(3c), 在安非他眯成瘾中富集(3d)。

图2.GSE17025 与TCGA数据分析韦恩图

图3.功能富集分析

2.核心DEGs鉴定与功能分析

作者进一步以p<0.05 ,|logFC|≥2为标准对DEGs进行筛选,找到了154个核心DEGs,同样进行GO与KEGG富集分析。4a-c为GO可视化结果,结果显示在生物过程模块,有丝分裂核分裂过程基因富集最多;在细胞组成模块,细胞外隙基因富集最多;在分子功能模块,微管蛋白结合功能基因富集最多(4a,4b),作者进一步分析得到了10个显著富集的GO terms与基因间的关系(4c)。KEGG分析结果显示DEGs在IL-17通路,趋化因子信号通路,TNF信号通路中富集(4d)。

图4.核心DEGs富集分析

3.PPI网络与聚类分析

作者从STRING数据集中获得蛋白质间相互作用的信息(PPI),使用Cytoscape可视化结果,获得了PPI网络。5a显示DEGs-PPI网络共包含154个点代表154个DEGs对应的蛋白质,382条边代表蛋白质间相互作用。作者分析了其中30个关键蛋白,做出5b关键蛋白直方图,y轴表示基因名称,x轴表示相连基因数量,柱长表示基因间的连接数量,结果表明NCAPG与其他基因的连接最多。

图5.PPI网络聚类分析

然后作者使用MCODE插件对PPI网络进行聚类分析,将其分为了四个模块,6a-6c分别展示了模块1-3的聚类结果,模块1包含25 个节点和284 个连接(6a), 模块2包含 7 个节点和 21 个连接 ( 6b), 模块3包含8个节点和11个连接(6c), 模块4包含3个节点和3个连接。进一步作者对4个模块进行功能分析,分析各个模块对EC的影响。GO富集分析结果显示模块1 DEGs在微管运动,肌动过程和微管结合中富集(7a);模块2 DEGs在趋化因子受体结合,CXCR趋化因子受体结合,细胞因子受体结合,G蛋白偶联受体结合,细胞因子受体活性和配体活性中富集(7b) ;模块3 DEGs在内肽酶抑制剂活性,内肽酶调节剂活性,肽酶抑制剂活性,肽酶调节和转录激活活动,RNA聚合酶II启动子近端序列特异性结合过程中富集(7c)。KEGG富集结果显示模块1在细胞周期通路中富集(7d),模块2在趋化因子信号通路与细胞因子受体间相互作用中富集(7e),模块3在 IL-17信号通路中富集(7f)。

图6.PPI网络模块分析

图7.各模块的GO与KEGG富集分析

4.可能有效的小分子药物

CMap是一种使用计算机模拟药物对生理状态影响的方法,如果得出正相关分数,表明药物会诱导相关生物过程;得出负相关分数,表明药物可以逆转相关生物过程,可能有治疗作用。作者使用CMap对比EC样本与健康组织,筛选出了呈强负相关的药物,8a-8c展示了top3分子药物结构,它们可能对EC治疗有效。

图8.top3分子药物

5.预后标志物鉴定

作者使用单因素CoxPH分析,以p<0.05为标准,筛选出预后相关DEGs, top10为MAL, BCHE, P2RY14, ASPM, CA3, FAM13C, FAM83D, CXorf57, SFN,CPED1,再对它们进行多因素CoxPH分析排除干扰因素影响,最终确定了BCHE, FAM13C, CA3, P2RY14, ASPM,MAL 。按照6个基因表达进行风险评分:

Risk score=0.126BCHE−0.121FAM13C+ 0.136 *CA3− 0.139 * P2RY14+0.231 ASPM+0.0892MAL

根据风险评分,作者将病人划分为高低风险组。9a生存曲线显示高风险组预后明显较差,然后做出5年生存率ROC曲线,AUC=0.751表明预测准确度较高(9b)。9c通过散点图展示了两组病人风险得分,虚线表示两组的分界,红色为高风险组,绿色为低风险组。9d为两组病人生存时间分布,绿色表示存活,红色则为死亡。9e展示了6个基因标志物表达,红色代表高表达,绿色代表低表达。

图9.基于6个核心基因的生存分析

作者使用单因素与多因素CoxPH回归分析了基于6个基因表达水平的风险得分与其他临床指标,结果显示排除其他因素干扰,肿瘤状态与风险得分可以作为独立的EC预后影响因素。

表1.EC病人OS与6个基因表达关系的单因素与多因素分析

6.核心基因验证

作者使用R语言对BCHE, ASPM ,MAL进行突变分析,8a为BCHE突变分析结果,野生型与突变型两组基因表达差异明显,p=0.001有统计学意义。进一步作者对BCHE野生型和突变型病人进行生存分析,8b为两组的生存曲线,结果显示BCHE突变型病人预后更好,说明BCHE突变可能是EC病人的保护因素。

图10.BCHE验证

作者使用UALCAN网站分析MAL和ASPM在肿瘤组织和正常组织中的表达,11a,b结果显示两个基因在肿瘤组织中的表达均高于正常组织。然后作者对高表达或低表达两基因的病人进行生存分析,11c,d为对应的生存曲线,结果显示两基因的高表达组预后均较差,说明MAL和ASPM均与生存时间负相关。作者进一步分析了不同类型,不同分期EC组织中两基因的表达,12a,b结果显示在不同类EC组织中MAL和ASPM的表达均高于正常组织,12c,d结果显示不同分期EC中两基因表达同样高于正常组织,与上文结果一致。之后,作者使用SPSS 23.0进行ROC曲线分析评估MAL和ASPM区分EC组织和正常组织的能力,13a为ASPM结果,13b为MAL结果。

图11.UALCAN网站验证

图12.UALCAN网站验证

图13.使用ROC曲线与AUC评估MAL和ASPM区分EC组织和正常组织的能力

活体组织样本取下后在−80 °C环境保存,作者对其进行免疫组化染色,14a为正常组织染色结果,染色浅,强度弱,占比75 - 25%,区域为胞质/ 胞膜;14b为肿瘤组织染色结果,染色中等深度,强度中等,占比> 75%,区域为胞质/ 胞膜,说明肿瘤组织中ASPM表达比正常组织更高。

图14.ASPM免疫组化染色

作者使用Oncomine 4.5数据集对MAL的DNA拷贝数变异(CNV)进行分析,15A为MAL在TCGA子宫内膜与子宫内膜浆液腺癌数据集中的拷贝数箱线图,15B为MAL在TCGA子宫内膜与子宫内膜混合腺癌数据集中的拷贝数箱线图,15C为MAL在TCGA子宫内膜与子宫内膜样腺癌数据集中的拷贝数箱线图,与正常组织相比,在不同类型EC组织中CNV增高,且排名均在top5%。然后作者在活体组织中使用qRT-PCR分析基因表达水平,15D显示MAL在肿瘤组织的表达量显著高于正常组织。

图15.MAL拷贝数与临床样本验证

7.基因富集分析(GSEA)

为确认MAL与ASPM的潜在功能,作者进行了KEGG通路富集分析。fig.16为ASPM富集分析结果,8个ASPM高表达基因集中“细胞周期”,“ DNA复制”,“卵母细胞减数分裂”,“ p53信号通路”,“胰腺癌”,“孕激素介导的卵母细胞成熟”,“小细胞肺癌”,“泛素介导的蛋白水解 ”通路富集。fig.17为MAL富集分析结果,8个MAL高表达基因集中“ B细胞受体信号传导途径”,“膀胱癌”,“细胞周期”,“慢性粒细胞白血病”,“甘氨酸,丝氨酸和苏氨酸代谢”,“白细胞跨上皮迁移”,“胰腺癌”,“小细胞肺癌”通路富集。

图16.8个在EC中富集的ASPM 高表达基因集

图17.8个在EC中富集的MAL高表达基因集

小结

作者从GSE17025与TCGA 数据集中鉴定出EC相关DEGs,并对它们进行功能分析,做出的PPI网络图,发现NCAPG是EC中重要的功能蛋白。然后作者通过CMap函数,确定了3种EC治疗药物,分别为噻吩鸟苷,白藜芦醇和曲古抑菌素。最后,通过cox回归分析,经过突变分析,UALCAN网站分析,免疫组化,Oncomine数据验证,确定了3个潜在EC预后标志物:BCHE, MAL, ASPM。

(0)

相关推荐