分析TCGA数据库的工具这么多,我就只服这一个!
众所周知,以TCGA数据库为主的大数据挖掘很火,通过数据挖掘我们可以发SCI文章(比如),也可以为申请基金提供思路(比如师兄最近在各地的讲座:),当然关于TCGA的数据挖掘,公众号上也介绍了很多工具(比如,,,等),依凡老师还专门为大家录制了数据挖掘的课程(单击文末链接购买查看)。
今天给大家介绍一个闻着伤心听着落泪的网站,分析TCGA数据的工具这么多,我只服这一个,让人不得不感叹,做肿瘤真好!
这个网站是新上线的一个网站:LinkedOmics,网址:http://www.linkedomics.org/ 主页打开后是这样的:
具体功能太强大,且听我慢慢道来。
首先大家需要先注册账户,在右上角,具体注册方法就不说了。注册后登录打开界面是这样的:
整个分析一共包括五步:
(1)选择肿瘤类型,一共收录了32个癌种的各个类型的数据,比如我们选择肝癌LIHC:
(2)选择数据类型,我们可以看到数据的类型有microRNA,SNP,甲基化,临床数据和突变,我们先演示microRNA的,所以选第一个:
第二步里面还有一个可选项目:样本类型,可以进一步对样本根据分子分型、分期等数据进行分析,打开是这样的:
可以进一步选择,我们在演示的时候就不选了。
(3)选择数据属性,可以选择具体的microRNA,我们以hsa-mir-125a为例:
(4)选择靶数据类型,同样我们可以选择前面的数据:
比如我们想看hsa-mir-125a与临床信息的关系,我们选下Data type为Clinical的选项即可。
(5)选择统计方法,一般会给出几个选项,比如这个:
选好后接下来就是分析了,
我们看一下:
单击View按钮:
就可以看到hsa-mir-125a与临床信息的关系了,比如生存分析、TNM分期、种族等:
当然,在第四步我们选择靶数据类型的时候,我们可以换成其它的数据,比如RNAseq的数据,我们来找一下hsa-mir-125a的靶基因:
统计方法我们选个spearman相关性分析:
提交后查看数据是这样的:
我们可以单击某个基因看hsa-mir-125a与该基因表达相关性,在下面有两张图展示的是与hsa-mir-125a表达正相关和负相关的基因热图,
我们挑选第一个基因MLXIPL进行搜索:
然后查看他们表达的相关性结果:
至于MLXIPL是不是hsa-mir-125a的靶基因以及在肝癌中的作用如何,大家就可以通过targetscan等软件预测并验证了。
当然,这里还有一个相关基因的功能富集,分别是ORA和GSEA:
我们选GSEA看看,
富集分析的选项包括了GO分析等:
我们选个KEGG pathway吧,提交后大家要等一下:
好了以后的界面:
结果可下载可查看:
好了,网站的功能还有很多,大家自己探索吧。
用好这个网站,文章基金神马的都不是事儿! 最后,大家用的时候记得引用文章:
LinkedOmics: analyzing multi-omics data within and across 32 cancer types.Nucleic Acids Res. 2017 Nov 9. doi: 10.1093/nar/gkx1090.