非肿瘤入门分析就能轻松2+分!

今天给大家带来的是2020年3月发表在Biomed Research International(IF=2.276)杂志上的文章“Investigation of Potential Genetic Biomarkers and Molecular Mechanism of Ulcerative Colitis Utilizing Bioinformatics Analysis”。这篇文章通过DEGs筛选、加权基因共表达网络分析(WGCNA)、GO分析、KEGG分析,鉴定hub基因并进行数据验证以确保可靠性,揭示溃疡性结肠炎的分子机制,为溃疡性结肠炎基因治疗提供潜在的生物标志物。

Investigation of Potential Genetic Biomarkers and Molecular Mechanism of Ulcerative Colitis Utilizing Bioinformatics Analysis利用生物信息学分析探讨溃疡性结肠炎的潜在遗传标志物和分子机制

一.研究背景

溃疡性结肠炎(UC)是一种直肠和结肠的慢性非特异性炎症,其病因和发病机制尚不明确。通过生物信息学分析溃疡性结肠炎数据集,为进一步探索炎症性肠病的发病机制提供理论参考,并有助于寻找潜在的靶基因。

二.分析流程

三.结果解读

1.鉴别差异表达基因

从GEO数据库下载GSE87473数据集,使用GEO2R筛选DEGs(PFDR < 0.05 , |log2FC| > 1)。共发现466个上调基因,522个下调基因。热图和火山图如图1a和1b所示。热图表明这些DEG可用于区分UC和对照样品。

图1. UC组和对照组之间DEGs的热图、火山图和WGCNA分析

2.WGCNA分析

对鉴定到的988个DEGs进行加权基因共表达网络分析(WGCNA)。

  • 为了确保网络是无尺度网络分布,作者选择了β= 6作为软阈值(图1c)。

  • 通过分级聚类把DEGs分为5个模块(图1d)。

图2. 使用热图展示模块的表达模式

图3. 模块特征基因与样本之间的关系

对鉴定到的模块进行分析:

  • 模块的表达模式:绿松石和蓝色模块被下调,而棕色和黄色模块被上调(图2)。

  • 模块与疾病的相关性:图3a,左侧为模块与疾病程度的相关性,右边为模块与疾病存在的相关性。

  • 平均基因显著性(average gene significance (GS)):棕色模块与疾病的存在关系最密切,绿松石模块与疾病的程度的关系最密切(图3b)。

3.GO和KEGG分析

对上一步鉴定到的与疾病存在和进展关系最密切的棕色和绿松石色进行GO-BP(生物过程)和KEGG富集分析。

  • 表1展示了GO-BP和KEGG富集前3的条目。

  • 棕色模块的DEGs在功能上主要涉及炎症反应(P = 4.88E-07),通路上主要是趋化因子信号通路(P=0.004195)(图4ab)。

  • 绿松石模块中的DEGs在功能上主要涉及氧化还原(P = 9.70E-3),在通路上主要是代谢通路(P = 2.8E-09)(图4cd)

图4 GO-BP和KEGG富集分析的结果

4.hub基因筛选

因为棕色模块与疾病最相关,所以作者对棕色模块进行hub基因的筛选。根据每个模块的特征向量,通过WGCNA分析模块中基因表达的相关性,将每个模块中相关性大于0.9的基因视为hub基因。

  • 图5显示,DUOXA2、 SAA1和SAA2、TNIP3、CXCL1、SLC6A14和CD55被选为hub基因。

图5. 棕色模块的hub基因筛选

5.数据有效性

为了验证hub基因的稳健性,从GEO数据库中下载GSE75214数据集。

  • 鉴定的hub基因在验证集也存在差异(图6a)。

  • 进行ROC曲线分析:6个hub基因的曲线下面积在0.8097至0.9822之间。表明这几个hub基因可以作为UC诊断的潜在组织活检分子(表2和图6b)。

图6. hub基因在验证集中的表达以及ROC曲线

小结

作者利用GEO数据库,分析差异表达基因后,使用WGCNA进行模块分析,随后对相关性高的模块进行GO和KEGG富集分析,并进一步选择相关性最高的模块进行对hub基因的鉴定。最后使用另一个数据集进行了验证。最终表明DOUXA 2、A-SAA、TNIP3、CXCL1、SLC6A14和CD55可能作为UC组织活检的潜在生物标志物。

(0)

相关推荐