非肿瘤(口腔科)也做数据挖掘啦
一提到数据挖掘,可能大家都会想到肿瘤数据挖掘,而是忽略非肿瘤的方向。今天,我们就给大家介绍一下非肿瘤方向的数据挖掘。作者是日本人,研究是的慢性牙周炎,也就是口腔科,文章发表在BMC Oral Health上,该期刊的影响因子为:1.602,虽然不是很高,但是都能满意一般研究生的毕业、医生的评职称。这篇文章利用的数据就是GEO数据,整天文章没有用到任何代码,用的分析就是平时做的分析差异分析,GO富集分析,KEGG富集分析,PPI分析,还有就是筛选hub基因,像这样的文章,我们之前也介绍过不少,这样的分析就不再讲了。
文章题目:
Investigation of molecular biomarker candidates for diagnosis and prognosis of chronic periodontitis by bioinformatics analysis of pooled microarray gene expression datasets in Gene Expression
Omnibus (GEO)
摘要:
背景:慢性牙周炎(CP)是一种多因素的炎症性疾病。对于CP的诊断,有必要研究CP的分子生物标志物和生物学途径。尽管用微阵列分析mRNA表达谱可用于阐明多因子疾病的病理机制,但它是昂贵的。因此,我们利用汇总的微阵列基因表达数据在数据共享的基础上进行减少
杂交成本和补偿不足的mRNA采样。本研究的目的是使用Gene Expression Omnibus(GEO)数据库中的合并数据集来鉴定CP的分子生物标志物候选物和生物途径。
方法:三个合并的转录组数据集(GSE10334,GSE16134和GSE23586)的牙龈组织与CP,使用GEO2R,功能分析和生物途径分析GEO数据库的差异表达基因(DEGs),使用数据库注释可视化和集成发现数据库,蛋白质 - 蛋白质相互作用(PPI)网络和中枢基因以及用于检索相互作用的搜索工具用于诊断和预后的基因数据库和生物标志物候选物以及具有独创性的显性生物标志物候选物的上游调节物途径分析数据库。
结果:我们在GEO数据库中共享了汇集的微阵列数据集。在含有CP的牙龈组织中发现了123个常见的DEG,包括81个上调的基因和42个下调的基因。基因本体论中的上调基因在免疫应答中显着富集,并且京都基因和基因组途径百科全书中的那些基因在细胞因子 - 细胞因子受体相互作用途径,细胞粘附分子和造血细胞谱系中显着富集。从PPI网络中,筛选出具有最高程度的12个节点作为中枢基因。另外,筛选了六种用于CP诊断和预后的生物标志物候选物。
结论:我们确定了几种用于CP诊断和预后的潜在生物标志物(例如,CSF3,CXCL12,IL1B,MS4A1,
PECAM1和TAGLN)和用于CP诊断的生物标志物候选物的上游调节剂(TNF和TGF2)。我们还确认了CP发病机制的关键基因,如CD19,IL8,CD79A,FCGR3B,SELL,CSF3,IL1B,FCGR2B,CXCL12,C3,CD53和IL10RA。据我们所知,这是第一份揭示CD53,CD79A,MS4A1,PECAM1和TAGLN与CP关联的报告。