Oncomine数据库是生信入门必备数据库,它操作简单,结果可靠,但是Oncomine也有它的缺点,那就是免费版不能下载数据,为了解决这个难题,我们团队基于R语言开发了程序包:oncomineR。oncomineR包中只有1条命令oncomine(),它可以整理Oncomine数据库中的条形图数据、箱图数据、热图数据、meta分析数据、summary数据等几乎所有类型的数据,几乎实现了全垒打!oncomine()命令只有1个参数mhtml,它可以是一个或者多个文件名,指的是插件save as MHTLM下载的网页内容。oncomineR包需要配合插件Save as MHTML一起使用,所以,首先我们需要先来安装这个插件,以chrome浏览器为例。①在浏览器中打开插件下载链接:https://www.gugeapps.net/webstore/detail/save-as-mhtml-mime-html/djbjejcpegcimjdappppobfhaafbmjpf
oncomineR包并未传到CRAN上,而是传到了github上,所以需要从github上来安装,安装命令如下:devtools::install_github('yikeshu0611/oncomineR')
oncomineR包的开发使用到了do包,rvest包,xml2包,magrittr包,这些包以及它们的依赖包会在安装oncomineR包的时候一起自动安装。oncomineR包几乎可以整理oncomine数据的所有类型的数据,使用方法完全相同,这里仅演示条形图数据。例如,我们搜索p53基因在bladder cancer中的表达,点击链接即可进入页面。① 点击GROUP BY右侧的下拉窗口,选择Age选项。
这样年龄(Age)数据就下载下来了,如果你还想下载其他数据,重复上面2个步骤即可。使用oncomineR包中的oncomine()命令来整理。# # 设置工作目录setwd('D:/destopfile/oncomine') # 调用oncomineR包library(oncomineR) #整理数据r = oncomine('Age.mhtml') head(r)
多个数据文件的整理方法和单个数据文件的方法是一样的,都是先下载,再整理。例如,我们要整理性别(Sex)、随访时间(Overall Survival Followup Time)、生存状态(OverallSurvival Status)等其它的数据,并且把这几个数据合并到一起。首先我们下载这几个数据,并将文件夹分别命名为Sex,Overall Survival Followup Time和Overall SurvivalStatus;然后再使用oncomine()来整理即可。# 设置工作目录
setwd('D:/destopfile/oncomine')
# 调用oncomineR包
library(oncomineR)
#整理数据
r = oncomine(c('Overall Survival Followup Time.mhtml',
'Overall Survival Status.mhtml',
'Sex.mhtml'))
head(r)
配合save as MHTML插件,可以很方便地下载Oncomine数据库的数据,整理单个数据的时候,LegendValue就是结果,整理多个数据的时候,Legend Value会被文件名替换。致谢:oncomineR的开发得益于save as MHTML的开发,首先向该插件的开发者致谢,其次oncomineR的开发使用直接使用到do包,xml2包,rvest包及magrittr包中的某些函数,向这些包的开发者致谢,最后感谢R及RStudio的全体工作人员。报错地址:https://github.com/yikeshu0611/oncomineR/issues