肿瘤、非肿瘤都适合的数据挖掘套路

按照今天介绍的这篇文章套路,肿瘤、非肿瘤方向都适合学习,发文也很简单,这种套路非常适合新手。这篇文章发表在BIOMEDICAL REPORTS。这篇文章的目的就是为了确定食管癌相关比较重要的基因和通路。

既然目的清晰了,思路也很简单、清晰:

  1. 从GEO中下载数据GSE92396(就一张芯片,二十几个样本)

  2. limma包进行差异分析(疾病 vs 正常)

  3. 对差异基因做GO富集分析

  4. 对差异基因做KEGG富集分析

  5. PP分析

  6. 筛选hub基因和子网络

文章中出现的图和表:

整篇文章就上面这些图和表,没有复杂的东西,数据也是只有一张芯片,样本也不多,也没有高大上的图。上次我们介绍的那篇文章也是只分析一张芯片的。这种文章你们完全可以做到,因为不需要复杂的代码,更不需要配置高的电脑,也不需要高大上的图片处理技术。

虽然这篇文章是研究食管癌的,也就是研究肿瘤,但是没有做生存分析。非肿瘤方向的朋友完全照着这篇文章做,因为GEO数据库里面还有其他疾病,你搜索你需要研究的疾病即可。

文章题目和出处:Identification of genes and pathways in esophageal adenocarcinoma using bioinformatics analysis (DOI: 10.3892/br.2018.1134)

(0)

相关推荐