没有时间做实验那就来跟我们做数据挖掘
很多临床医生都是很忙的,并没有像研究生那样有足够的时间做实验。但是我们又需要发文章,以及培养科研思维。那么,有没有其他方法既可以发文章又可以科研思维呢?答案肯定就是有的。例如搞搞meta分析,meta分析不认可?不要紧的,我们还可以挖掘生信数据,同时我们还可以挖掘临床数据。数据挖掘,数据挖掘,就是利用别人辛辛苦苦做实验的数据来发自己的文章,这个过程是比较简单的。我们只需要找到相关的数据,然后一些统计分析,得到相关的图表就可以出来一篇篇SCI。在这个数据挖掘的过程中,你最多的就是复制运行一下代码,或者点点鼠标,根本不是复杂的计算机知识,更不会有天天熬夜养细胞的痛苦,更不会有天天对着一笼小白鼠的痛苦。
现在我们来展示一篇数据挖掘的文章,看看到底难不难,大家可以看看这篇:Bioinformatics Analysis and Identification of Genes and Molecular Pathways Involved in Synovial Inflammation in Rheumatoid Arthritis
这篇文章具体的操作就是这样子的:
第一步,在GEO数据库上检索相关的研究方向,然后找到后进行差异分析
第二步,如果有多个数据集就可以直接取交集
第三步,将得到的差异基因做GO富集分析
第四步,将得到的差异基因做KEGG富集分析
第五步,将差异基因进行PPI分析和筛选hub基因
这是比较简单也是比较典型的数据挖掘,其实还是很多分析方法和发文套路。现在我们再来看看临床数据挖掘:
这是一篇利用SEER数据做临床预测模型的文章,这篇文章发表在Journal of Thoracic Disease上,该期刊的影响因子为1.8,这类文章是算Original Article,完全可以用来毕业,评职称。
文章题目:Clinicopathological characteristics and prognosis of pulmonary pleomorphic carcinoma: a population-based retrospective study using SEER data
下面,我们来看一下这篇文章的发文套路:
1、从SEER数据库上下载数据
2、整理好数据,准备构建Cox回归模型
3、构建Cox回归模型
4、绘制列线图
5、计算C指数
6、绘制校准图
7、对各因素进行KM生存分析
可见,这种发文套路是非常清晰的,无论是自己收集的医院数据,还是SEER数据,TCGA临床数据,TARGET临床数据,都可以发这样的文章,总结为下面的套路:
如果想快速掌握这些操作技能,可以学习我们的课程~其实,SEER数据挖掘,这样玩才爽的,这样就可以大大帮你节省非常多的时间,当然你也可以自己上网百度慢慢摸索的,觉得自己有这样的能力是完全可以的。这样数据挖掘的文章通常比的不是智商高低,而是看谁的速度快,有些学员已经发了3-5篇这样的文章了,而有些人还在百度寻找怎么样下载SEER数据。
总的来说做肿瘤研究的医生是比较幸运的,因为数据挖掘基本是挖掘肿瘤数据,当然非肿瘤也是可以挖掘的,只是数据量比较少,很多罕见的疾病是做不了的,这样子只能做meta分析,如果meta分析也做不了,可以尝试写病历报道。