GEO数据纯生信准3分SCI思路
研究背景:
卵巢癌在全球与妇科癌症相关的死亡中排名第五。到目前为止,尚未完全了解卵巢癌的肿瘤发生和预后的分子机制。这项研究旨在发现参与卵巢癌的hub基因和治疗药物。
研究方法:
从Gene Expression Omnibus(GEO)数据库上下载了四个基因表达谱数据(GSE54388,GSE69428,GSE36668和GSE40595),并且利用首次GEO2R和FunRich软件分析在卵巢癌组织和正常组织中差异表达的基因,过滤条件为:矫正后P值为<0.05, |log fold change (FC)|| > 1.0。接下来,进行了基因本体论(GO)和京都基因与基因组百科全书(KEGG)分析,以对这些差异基因进行功能富集分析。然后,通过cytoHubba插件筛选hub基因,并进行其他生物信息学方法,包括蛋白质-蛋白质相互作用(PPI)网络分析,模块分析,生存分析以及miRNA-hub基因网络构建。最后,利用GEPIA2和DGIdb数据库分别验证hub基因的表达水平并选择卵巢癌候选药物。
研究结果:
总共确定了171个差异基因,包括114个上调的差异基因和57个下调的差异基因。 GO分析的结果表明,上调的差异基因主要参与细胞分裂,细胞核和蛋白质结合,而显示下调的差异基因富集的生物学功能主要是RNA聚合酶II启动子,蛋白质复合物和apicolateral的转录负调控。质膜与糖胺聚糖结合。关于KEGG信号通路,上调的差异基因主要与代谢途径,抗生素的生物合成,氨基酸的生物合成,细胞周期和HTLV-1感染有关。此外,还确定了10个hub基因(KIF4A,CDC20,CCNB2,TOP2A,RRM2,TYMS,KIF11,BIRC5,BUB1B和FOXM1),并且这些hub基因的生存分析结果表明,高表达的CCNB2,TYMS,KIF11,KIF4A,BIRC5,BUB1B,FOXM1和CDC20更可能具有较差的无进展生存期。同时,基于GEPIA2的hun基因的表达水平与基于GEO的hub基因的表达水平一致。最后,DGIdb数据库被用来识别62种小分子,它们可能是卵巢癌治疗的潜在靶向药物。
研究结论:
总之,这些数据可能会产生有关卵巢癌发病机理和治疗的新见解。hub基因和候选药物可能会在将来改善卵巢癌的个性化诊断和治疗。
分析思路:
1、下载四GEO数据,分别做差异分析,取交集差异基因(区分上下调)
2、GO、KEGG富集分析
3、PPI分析,筛选hub基因
4、hub基因的单因素cox 分析,绘制生存曲线
5、利用GEPIA2验证hub基因表达水平(cancer vs normal)并且进行临床的相关分析
6、构建gene-miRNA网络
7、构建drug-gene网络,挖掘潜在的药物