3+经典非肿瘤生信套路,值得收藏学习!
文章名:Identificationof KIAA0513 and Other Hub Genes Associated With Alzheimer Disease UsingWeighted Gene Coexpression Network Analysis。
本文作者在GEO上检索了阿尔兹海默症(AD)的数据集,并通过WGCNA和PPI得到了AD的核心基因(hub genes)并进行验证。方法简单易学适合模仿。
文章技术路线流程图如下:
结果部分:
Figure 1 为流程图,开门见山,说明文章的思路和数据处理流程。
Figure 2:作者用combat函数整合了GSE122063,GES36980和GSE5281三个数据集后做了差异分析,用Circos圈图展示前100位的差异表达基因(DEGs),圈图比一般使用的火山图和热图更美观精致,且能包含了染色体的位置信息。
Figure 3:常规操作,将figure2中的DEGs做GO和KEGG富集分析,使用clusterprofiler包做了弦图展示富集的前五的通路。
Figure 4:文章的核心部分,WGCNA分析:A图,样本聚类;B图,软阈值筛选;C图动态树剪切,建立模块;D图,合并相似模块;E图,模块与样本临床特征关联性;F图,各模块与AD的关联性。结果表示,绿色模块GS值最高,与AD关联性最强,且为负相关(-0.57),表示该模块中含有AD的抑制基因。
Figure 5:A图,绿色模块中的基因和AD的相关性分析;B图,绿色模块中的基因构建的PPI网络图,其中有黑圈的为hub基因;C-F:绿色模块中的基因的GO和KEGG富集分析
Figure 6:作者挑选了hub基因中没有被报道过与AD有关的基因(AP3B2、GABRD、GPR158、KIAA0513、MAL2)在其他的数据集中进行验证,这5个基因都在AD中低表达,表示是AD的抑制性基因。
Figure 7:使用PCR在动物模型组织上进行验证,同样发现该5个基因在AD疾病模型小鼠的大脑皮质中低表达,与生信分析的趋势一致。
Figure 8 :图A:随着AD的进展,5个Hub基因表达下调,尤其是AP3B2、KIAA0513和MAL2。图B-C:5个HUB基因与β分泌酶活性和Aβ42水平呈负相关(β分泌酶活性和Aβ42水平在AD进展过程中被证实上调),进一步验证这5个基因是AD的抑制基因。
Figure 9:图A:差异分析,KIAA0513可以区分CN、MCI和AD;图B:ROC曲线,验证KIAA0513可以作为AD诊断标志物;图C:KIAA0513的单基因GSEA分析。
总结:文章通过差异表达分析和WGCNA分析,获得了AD的核心模块。对模块中的基因进行了PPI分析和GO、KEGG富集分析,获得了5个hub基因,并在不同的数据集以及实验动物模型上进行了简单验证,证明了这5个基因都与AD进展负相关,5个基因都是AD的抑制基因。最后再对KIAA0513进行了研究,证明了KIAA0513具有作为AD的诊断标志物的作用,并对其做了单基因的GSEA富集分析。