在我们的shiny服务器再部署个芯片下游分析网页工具
前面我们提到了在我们的shiny服务器部署一个RNA-seq下游分析网页工具,虽然说因为时间关系没办法给它写一步步教程,而且也的确类似的工具太多, 写教程的时间付出并不经济。那我们再介绍一个shinyGEO吧,跟前面的Shiny-Seq名字很相似,应该是主攻芯片数据分析,一个是主动测序数据处理,都是基于表达矩阵的。
一句话描述shinyGEO功能
查看感兴趣的基因在感兴趣的数据集里面,是否有分组后的表达差异或者生存分析的统计学显著性!
所以全文只有一个配图:(小声逼逼,可以说是丑爆了)
但是它并不提供芯片探针的ID注释,当然,缺陷实在是有点多,只能说是一个好的学习shiny网页工具制作的例子,并不算是完善的工具。
shinyGEO比较有趣的是,它本身被打包成为了一个R包,同时提供一个网页工具。发表在:Bioinformatics. 2016 Dec 1; 题目是:shinyGEO: a web-based application for analyzing gene expression omnibus datasets.
这两个工具名字类似:
shinyGEO:零编程基础分析GEO表达数据
https://github.com/jasdumas/shinyGEO
scanGEO:整合多个GEO数据集
https://github.com/StantonLabDartmouth/AppScanGEO
大家可以对比学习!我们下次再介绍scanGEO的用法。
部署shinyGEO需要安装一些R包
基本上是需要设置R包安装镜像的,参考:http://www.bio-info-trainee.com/3727.html 其中 install_github 函数需要从GitHub下载,会有其它难度,我们以前在生信技能树也分享过教程,大家可以自行搜索查看。
因为我是安装在自己的Ubuntu服务器里面,所以其实还蛮难的,各种报错,斗智斗勇的解决掉了。如果你不会shiny,就不用管它的部署问题。下载源代码,一步步安装即可,log目录是 /var/log/shiny-server 只有同属于shiny组的用户才能访问,只有在需要调试代码的时候才需要去查看默认程序存放在:/srv/shiny-server ,我们的这个网页工具也是
rm(list = ls())
options()$repos
options()$BioC_mirror
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos
options()$BioC_mirror
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install('affy')
library(devtools)
install_github("jasdumas/shinyGEO")
这个网页工具开发的很棒,比较容易部署,虽然说,依赖的R包也不少,使用下面的代码批量安装那些缺失的包,如下:
packagesReq <- c("DT",
"shiny",
"GEOquery",
"Biobase",
"reshape2",
"survival",
"shinyBS",
"GGally",
"ggplot2",
"shinyAce",
"knitr",
"rmarkdown",
"RCurl",
"shinyjs",
"survMisc",
"shinyAce",
"RCurl",
"shinyBS",
"shinydashboard",
"devtools")
packToInst <- setdiff(packagesReq, installed.packages())
packToInst
if(T){
lapply(packToInst, function(x){
BiocManager::install(x,ask = F,update = F)
})
}
lapply(intersect(packagesReq, installed.packages()),function(x){
suppressPackageStartupMessages(library(x,character.only = T))
})
library(rJava)
大部分,都是shiny相关的R包,非常值得学习,如果确定要走网页开发这条路。
网页工具用法
网页工具部署成功后,使用起来非常简单,输入一个自己需要处理的表达矩阵数据集即可,比如:GSE10009:
实际上就是调用GEOquery包去GEO数据库下载文件,所以这个非常慢,因为中国大陆的网络问题。我以前在生信技能树的芯片万能解决方案里面就有这个解决方案:
欢迎大家提交GEO数据库中国区镜像试用体验,也可以加入交流群:4年前的TCGA重磅资料你学了 这个工具我也准备修改源代码,让它使用我的下载链接,不过这个星期在马来西亚休假,所以不是很想动手去写代码,是时候休息几天了。
有了数据集,接下来使用的分析就中规中矩啦
首先肯定是分组:
也许是我没有看仔细,并没有全局差异分析,只能是选择某个探针/基因进行处理分析!
而且探针并没有注释到基因,也不可能进行后续的GO/KEGG注释。
该工具的优点
首先,整体页面布局很美观,采用的主题符合我的审美,而且每个功能分步骤安放很容易理解,新的步骤衔接起来比较容易理解。
尤其那些shiny插件包用的出神入化,绝对是初学者宝藏
还记得生信技能树的传送门系列吗?转录组、甲基化、ChIP-Seq、lncRNA、编程实战…
都非常成功,培养了非常多的技能树优秀小伙伴,形成了华语圈最大的生物信息学交流社群,以及B站的74小时生信工程师技术教学视频。
因为shiny网页工具开发,也是生物信息学一个重要的方向,这方面我们也聚集了不少志同道合的小伙伴以及收集整理了系统性的资料,希望把圈子扩大,老规矩!