基于两种不同算法的可变剪切数据库
关于可变剪切研究的数据库,尤其是在肿瘤当中研究可变剪切的数据库。之前我们介绍过了[[tsvdb-可变剪切分析数据库]]以及[[TCGA Spliceseq-可变剪切相关数据库]] 这两个基于 TCGA 构建的数据库。这两个数据库当中,一个用来可视化可变剪切的情况,另外一个则提供了可变剪切数据的整体分析。
对于利用 TCGA 数据来进行可变剪切预测而言,基于不同的算法可能得到的剪切变异体结果就不一样。以上两个数据库都是基于 SpliceSeq 算法来进行预测的。而可变剪切事件的分析还有另外一个算法 SplAdder 算法。所以今天就给大家介绍基于以上两个算法来预测可变剪切事件的数据库 OncoSplicing: http://www.oncosplicing.com/ 。
背景数据
在 OncoSplicing 数据库当中,作者使用了 TCGA以及GTEx 两个大型的测序数据来进行分析。在对可变剪切鉴定的算法的使用上, 作者把 SpliceSeq 以及 SplAdder 两个算法都分别进行了分析。其中 SpliceSeq 算法分析的可变剪切事件也是主要来自于 TCGA Spliceseq 数据库。而 SplAdder 算法分析的可变剪切事件则包括了 TCGA + GTEx 的数据。
关于 TCGA和 GTEx是什么内容可见: TCGA、ICGC、GTEx 数据库都是啥?
另外由于算法不同,对于可变剪切事件的定义也不同。具体的区别可以在👇 这个图中看出。在图中可以看出 SpliceSeq 对于剪切事件的定义要比 SplAdder 多几个种类。
至于说对于可变剪切事件定量 PSI 定义也是不同的
数据库使用
在 OncoSplicing 当中 作者提供了四个用来分析可变剪切事件的选项。
基于 SpliceSeq 算法分析的结果查询
基于 SpIAdder 算法分析的结果查询
基于两种算法的泛癌分析
基于两个算法的临床事件分析
由于每一个功能都是类似的,我们就只是简单的介绍一下==临床事件==的使用。
在临床事件分析里面,数据库首先是通过一个表格的形式来展示所有结果的。我们可以在上面的选项当中,选择想要查看的癌种,临床特征以及想要查看的基因等等。
对于每一个分析的结果,点击右边的Plot就可以知道具体的箱式图的具体结果
总的来说
以上就是这个数据库的基本用法了。除了基本的查询以外,作者也提供了所有数据的下载情况。有兴趣的可以下载所有的数据来进行自己的自定义分析