都2021了仍然有人转录组走tophat加cufflinks流程

我在2015年逛biostar论坛的时候,看到了这样的表述:

Tophat 首次被发表已经是6年前
Cufflinks也是五年前的事情了
Star的比对速度是tophat的50倍,hisat更是star的1.2倍。
stringTie的组装速度是cufflinks的25倍,但是内存消耗却不到其一半。
Ballgown在差异分析方面比cuffdiff更高的特异性及准确性,且时间消耗不到cuffdiff的千分之一
Bowtie2+eXpress做质量控制优于tophat2+cufflinks和bowtie2+RSEM
Sailfish更是跳过了比对的步骤,直接进行kmer计数来做QC,特异性及准确性都还行,但是速度提高了25倍
kallisto同样不需要比对,速度比sailfish还要提高5倍!!!

当时各路大神就建议大家抛弃传统的tophat加cufflinks流程,毕竟其作者都说它过时了,起码可以替换成为:hisat2+stringtie+ballgown流程啊!

又是六年过去了

还有人跟我讨论tophat加cufflinks流程,让我非常郁闷,而且对方还拿出来了最新文献,是:《The oncogene AAMDC links PI3K-AKT-mTOR signaling with metabolic reprograming in estrogen receptor-positive breast cancer》,链接是:https://www.nature.com/articles/s41467-021-22101-7

整个研究都是围绕 Adipogenesis associated Mth938 domain containing (AAMDC) 这个基因 。里面有转录组测序数据,在 GSE92893 and GSE123740. 可以看到这两个数据其实相差五年:

 

所以作者自己也是有两套流程,针对早期数据,走tophat加cufflinks流程。但是针对最近的数据,走salmon和DESeq2流程,完全是两码事!

如果你现在还推荐大家使用tophat加cufflinks流程来处理转录组数据,就有点过分了!

如果你看到有人还在使用tophat加cufflinks流程来处理转录组数据,也不要急于嘲讽,有可能是他们的数据本来就是五六年前的,或者给他们服务的公司仍然是使用过时的流程而已。

视频观看方式

  • 视频免费在B站:https://www.bilibili.com/video/BV12s41137HY 大家学习的时候记得发弹幕交流哈。

  • 也有微云离线版本视频下载本地播放:

    • 上游分析视频以及代码资料在:https://share.weiyun.com/5QwKGxi
    • 下游主要是基于counts矩阵的标准分析的代码 https://share.weiyun.com/50hfuLi
  • 同步查看视频配套代码 :https://www.jianshu.com/p/a84cd44bac67

  • RNA-SEQ实战演练的素材:https://share.weiyun.com/5h1Z2QY ,包括一些公司PPT,综述以及文献以及测试数据

  • RNA-SEQ 实战演练的思维导图:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo

目前,上面的链接都是亲测有效的,如果你看完发现链接无法打开,说明已经里面被举报而封杀了,只能是去交流群拿到最新链接了

需要基本生信背景知识

当然需要读者具备计算机基础知识,,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理

其中,R语言可能更重要一点,我把R的知识点路线图搞定,如下:

  • 了解常量和变量概念
  • 加减乘除等运算(计算器)
  • 多种数据类型(数值,字符,逻辑,因子)
  • 多种数据结构(向量,矩阵,数组,数据框,列表)
  • 文件读取和写出
  • 简单统计可视化
  • 无限量函数学习

如果大家没有时间自行慢慢学习,可以考虑我们生信技能树官方举办的学习班!

(0)

相关推荐