使用MA Anderson御用软件SpliceSeq对TCGA数据库的RNA-seq找可变剪切

MA Anderson御用软件SpliceSeq已经是发表于2012的文章了:《SpliceSeq: a resource for analysis and visualization of RNA-Seq data on alternative splicing and its functional impacts》

实际上这些年针对RNA-seq找可变剪切的工具软件发展迅速,发表在December 2019的综述:《Systematic evaluation of differential splicing tools for RNA-seq studies》

  • exon-based (DEXSeq, edgeR, JunctionSeq, limma),
  • isoform-based (cuffdiff2, DiffSplice)
  • event-based methods (dSpliceType, MAJIQ, rMATS, SUPPA).

SpliceSeq产生的可变剪切数据库

其实MA anderson已经使用御用软件SpliceSeq对TCGA数据库的全部的RNA-seq找可变剪切,并且把结果存放在网页工具,供所有人使用:https://bioinformatics.mdanderson.org/TCGASpliceSeq/

你可以很方便的在如何癌症里面查看你感兴趣的基因是否出现在TCGA数据库里面有可变剪切:

而且TCGA数据库的全部癌症的SpliceSeq软件结果数据都是可以下载的,所以催生了33*5篇数据挖掘灌水文章。

当然了,现在也有联合SpliceSeq软件结果与甲基化等其它数据结合起来灌水比如:https://bmcmedgenomics.biomedcentral.com/articles/10.1186/s12920-019-0654-9

下载及安装

文档写的很详细哦,https://bioinformatics.mdanderson.org/public-software/spliceseq/installation/

mkdir -p ~/biosoft/SpliceSeqcd ~/biosoft/SpliceSeqwget http://projects.insilico.us.com/SpliceSeq_2.3/SpliceSeq.zipunzip SpliceSeq.zip cd SpliceSeqjava -jar SpliceSeq.jar --help

如果仅仅是查看帮助文档,会出现看起来很像是报错的:

No X11 DISPLAY variable was set, but this program performed an operation which requires it.

因为这个java软件是有UI界面的,跟fastqc一样,为了方便那些并不会shell编程的朋友使用它,可以直接鼠标点击即可使用。

软件使用过程也有完善的文档:https://bioinformatics.mdanderson.org/TCGASpliceSeq/faq.jsp

具体细节也很多:https://bioinformatics.mdanderson.org/public-software/spliceseq/methods/

这个软件并不大;

361 Apr 29 2016 DB.properties2.0K Apr 29 2016 SGAnalyzer.properties2.4K Apr 29 2016 SGAnalyzerPrograms.properties4.6M Apr 29 2016 SpliceSeq.jar 498 Apr 29 2016 SpliceSeq.properties 126 Apr 29 2016 SpliceSeq.state.properties3.9M Nov 3 2016 SpliceSeqAnalyze.jar1.5K Sep 10 18:40 SpliceViewer.log 65 Nov 3 2016 example 953 Apr 29 2016 log4j.xml

它有两个功能

浏览器功能( SpliceSeq Viewer to Access the SpliceSeq DB)

这个通常是用不上的,因为我们可以直接在网页工具体验即可:https://bioinformatics.mdanderson.org/TCGASpliceSeq/

主要是还需要操作MySQL,这个东西对大部分生信工程师来说,都很难。

SpliceSeq Analyzer

需要配套的bowtie软件,如果是界面版本软件运行就比较简单

同样的需要读文档:https://bioinformatics.mdanderson.org/public-software/spliceseq/dataloading/

如果是命令行就复杂一点:

其实就是软件自带的 example 文件夹下面的两个配置文件需要修改啦。当然啦,作者本身其实推荐使用界面版本软件,方便配置。

结果解释

因为软件太古老,不想运行了,所以暂不解释。其实还是推荐其它软件工具哦,比如我前几年写过的教程:

更多资源

MA Anderson出品的其它软件:https://bioinformatics.mdanderson.org/public-software/

MA Anderson维护的TCGA数据库资源库:https://bioinformatics.mdanderson.org/StandardizedDataBrowser/

(0)

相关推荐

  • TCGA可变剪切预测数据库

    可变剪切(Alternative splicing,AS)是基因转录时,通过组合不同的外显子,形成不同转录本的过程,在生命的信息传递过程中发挥着重要的作用,维持蛋白质多样性的主要机制.在不同组织或者发 ...

  • 肿瘤miRNA靶点预测数据库

    miRNA作为ncRNA的一类.其主要发挥功能的主要方式是通过和基因形成双向互补链进而来影响基因的表达.因此通过miRNA和基因序列是否互补就可以遇到miRNA可能的靶基因了.这个基本上就是经典的预测 ...

  • 科研│PLANT J: 全球转录组分析揭示了拟南芥剪接事件的昼夜节律控制

    编译:微科盟 Nicole,编辑:微科盟景行.江舜尧. 原创微文,欢迎转发转载. 导读 拟南芥的昼夜节律控制着许多生理和分子过程,使植物能够预测其环境的每日变化.然而,mRNA水平变化如何与共转录/转 ...

  • RNA seq汇总篇,一文掌握RNA seq

    RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...

  • 可变剪切新模式: 外显子内含子剪切

    关于可变剪切,简单而言就是,一个基因从DNA-mRNA的过程当中,由于剪切位点的不同,会形成不同的mRNA剪切变异体.对于可变剪切模式,之前的介绍TCGA SpliceSeq数据库的时候提到了数据库当 ...

  • 基于两种不同算法的可变剪切数据库

    关于可变剪切研究的数据库,尤其是在肿瘤当中研究可变剪切的数据库.之前我们介绍过了[[tsvdb-可变剪切分析数据库]]以及[[TCGA Spliceseq-可变剪切相关数据库]] 这两个基于 TCGA ...

  • 顶刊日报|J Hepatol:通过长测序技术进行HBV RNA的可变剪切全景分析

    HBV是目前已知的感染人的最小DNA病毒,其基因组大小约为3.2 kb,包含4个高度重叠的开放阅读框(ORFs).除了这些经典的ORFs外,越来越多的证据表明,HBV还通过可变剪切形成了许多额外的OR ...

  • 谈一谈中国春基因转录水平上的证据

    从组装好的基因组序列到基因注释这一步,说简单也简单,说难也难.这里的难是指,在转录水平上做到95%以上的准确率,还是比较困难的.我们前面曾经介绍过基因注释的一些内容. 基因注释一般是指采用生物信息学的 ...

  • 生信文章新思路:TCGA 选择性多聚腺苷酸化

    一个文章套路的小故事 TCGA原始的数据库只有表达组学.甲基化.临床信息这些数据,所以大家在挖掘数据,最基本的就是在这几个组学里面来回的交叉融合.如果一个癌种别人交叉分析了,那其实基于基础的思路很难再 ...

  • TCGA计划的4个找somatic mutation的软件使用体验

    体细胞突变(somatic mutation)是指患者某些组织或者器官后天性地发生了体细胞变异,虽然它不会遗传给后代个体,却可以通过细胞分裂,遗传给子代细胞.体细胞突变对肿瘤的发生发展有关键性的作用, ...

  • 基于TCGA数据库肿瘤免疫细胞浸润分析流程

    分析基本思路: 1.首先我们应该要知道什么是肿瘤的免疫细胞浸润模式,通过一些什么样的原理,可以用什么样的软件进行分析. 肿瘤免疫细胞浸润是指免疫细胞从血液中移向肿瘤组织,开始发挥它的作用,可以从肿瘤组 ...

  • 利用TCGA数据库选题,毕业稳了

    利用TCGA数据库选题,毕业稳了

  • 免费资源 | 这份TCGA数据库肿瘤微环境课程,一定能帮助自学生信的你~

    让我们一起科研吧~ 小燕子 肿瘤微环境是当前研究的一个热点,无论是国自然还是发SCI,都是比较热的点,那么,数据挖掘也不例外,很多人喜欢追随这样的热点.(肿瘤微环境是指肿瘤的发生.生长及转移与肿瘤细胞 ...

  • TCGA的28篇教程- 对TCGA数据库的任意癌症中任意基因做生存分析

    长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的R ...

  • TCGA数据库的肿瘤病人也是有药物反应信息的

    在August 2018文章看到,作者使用了 49 FDA approved drugs to the 5605 tumor samples from 21 cancer types 这样的信息. T ...

  • TCGA数据库生存分析的网页工具哪家强

    看自己感兴趣的基因在自己研究的癌症的预后相关性是高频需求,其实就是拿到基因在癌症病人的表达信息,然后就可以根据表达量高低对病人进行分组,最后这个分组是否统计学显著的把病人的生存情况区分开来. 但是我没 ...

  • 开发自己的TCGA数据库下载器就是怎么简单

    如果你不懂代码,不懂网站规则,那么最简单的就是直接使用UCSC xena 浏览器啦!!!网站:https://xenabrowser.net/datapages/ 理论上也可以完成大部分数据探索的,甚 ...