开局一个转录组,收获一篇science

很多人都说传统的bulk转录组测序“廉颇老矣”,急急忙忙转向了单细胞转录组这样的热点技术。

诚然,单细胞CNS好文层出不穷,不过最近无意中看到了一个传统的bulk转录组测序的science,还是蛮值得分享的。本次要介绍的文章也不旧,发表于2019年2月,在science杂志,标题是;《Tumor metastasis to lymph nodes requires YAP-dependent metabolic adaptation》,链接是 https://science.sciencemag.org/content/363/6427/644

通篇文章就一个转录组测序数据,如果没有背景知识,拿到了这样的数据仅仅是分析的话基本上没有用,但是结合背景知识辅助大量的湿实验就是一个非常好的生物学故事,卖到了science杂志!

转录组数据介绍

样品分成如下所示的3组:

样品分成3组

表达量矩阵文件并没有上传到GEO数据库,我只看到了这个链接:https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-7621/

虽然没有表达量矩阵文件,但是有原始的测序数据在:https://www.ebi.ac.uk/ena/browser/view/PRJEB30960

ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090776/Macro3_GGCCAA_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090777/Macro5_AGAATC_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090778/Macro6_AGGCAT_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090779/Macro7_ACACGC_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090780/PT1_CAGGAC_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090781/PT2_CAGATG_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090782/PT3_GTAGAA_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090783/PT4_CGATCT_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090784/TDLN2_ATTGGT_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090785/TDLN4_GCAGCC_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090786/TDLN5_TGCTAT_L001_R1_001.fastq.gz
ftp.sra.ebi.ac.uk/vol1/run/ERR309/ERR3090787/TDLN6_CTCATA_L001_R1_001.fastq.gz

可以看到是12个样品,而且是单端测序数据文件。

完全不走寻常路的转录组测序数据分析

虽然这个数据集附带的文章发表在science杂志,并不能说明他们的转录组测序数据分析就是值得学习的!

我看了看文章附件:

  • Mapping of RNA-Seq reads were performed using Bowtie2version 2.1.0.
  • The alignment file was used to assemble transcripts, estimate their abundances,and detect differential expression of genes or isoforms using cufflinks.
  • The Read Count datawere processed based on Quantile normalization method using the Genowiz ™ version 4.0.5.6(Ocimum Biosolutions, India).
  • For bioinformatics analysis, each gene expression data wasannotated with official gene symbols, then normalized (log2). The principal component analysis(PCA) data were analyzed using Genowiz™ version 4.0.5.6 (Ocimum Biosolutions, India).
  • Unsupervised hierarchically clustered heatmaps were generated by using GeneCluster 3.0(University of Tokyo, Human Genome Center).
  • Gene set enrichment analysis (31) (GSEA) wasperformed with hallmark (h) or oncogenic (c6) gene set collections of the Molecular SignatureDatabase v6.1 (http://www.broadinstitute.org/gsea/msigdb).
  • Gene classification analysis andupstream regulator analysis was performed with Ingenuity Pathway Analysis (IPA, Qiagen).

确实是完全不走寻常路啊!其实常规的差异分析呢,基本上看我六年前的表达芯片的公共数据库挖掘系列推文即可;

我强调的转录组质控3张图也是存在的

首先是表达量热图:

热图看差异

文章的主成分分析图选择了3维:

PCA图看样品分组

这些图表绘制我都有公开课:

  • 视频免费在B站:https://www.bilibili.com/video/BV12s41137HY 大家学习的时候记得发弹幕交流哈。

  • 也有微云离线版本视频下载本地播放:

    • 上游分析视频以及代码资料在:https://share.weiyun.com/5QwKGxi
    • 下游主要是基于counts矩阵的标准分析的代码 https://share.weiyun.com/50hfuLi
  • 同步查看视频配套代码 :https://www.jianshu.com/p/a84cd44bac67

  • RNA-SEQ实战演练的素材:https://share.weiyun.com/5h1Z2QY ,包括一些公司PPT,综述以及文献以及测试数据

  • RNA-SEQ 实战演练的思维导图:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo

标准的差异分析和富集分析

首先是GSEA算法针对msigdb的结果:

GSEA算法针对msigdb

可以看到无论是micro- metastatic (Micro), 还是 macrometastatic (Macro) ,相比起 primary (PT), ,都有一个共同的  fatty acid oxidation (FAO). 通路在转移癌症里面是被激活的。

然后因为是大课题组,所以使用了土豪高配版  Ingenuity Pathway Analysis (IPA, Qiagen).  也是做生物学数据库注释:

Ingenuity Pathway Analysis (IPA,

可以看到即使你没有经费购买土豪高配版  Ingenuity Pathway Analysis (IPA, Qiagen).,普通的GSEA算法针对msigdb也是可以拿到合理的结果,聚焦到   fatty acid oxidation (FAO).

前面的分析定位到了FAO

然后就专门设计实验来证明 Fig. 2. Enhanced  FAO is required for  LN metastasis. 然后就需要弄清楚是什么激活了FAO,这个时候根据作者的背景知识选择性检查了 oncogenic signaling genes

Transcriptional coactivator yes-associated protein (YAP) is selectively activated in LN-metastatic tumors, leading to the up-regulation of genes in the FAO signaling pathway.

实验证明最显著的是;metastasis-adapted B16F10 cells transfected with small interfering RNAs (siRNAs) targeting the indicated genes (n = 4 samples for each group). siCtrl, control siRNA; siMYC, siEGFR, siKRAS, and siAKT, siRNAs for MYC, epidermal growth factor receptor, KRAS, and AKT, respectively.

 

文章最后针对 FAO 的具体机制又看了看两个通路 ,所以有了;

  • Fig. 3. YAP activation is critical for enhanced FAO and tumor LN metastasis.
  • Fig. 4. LN-metastatic tumors produce bile acids that can activate YAP, and YAP activation is correlated with melanoma LN metastasis and patient survival.

如果你拿GSEA算法针对msigdb的,其实哪怕是仅仅是挑选统计学显著的,也是几百个以上的通路被富集到,如果没有足够的背景知识去人为选择结果进行后续生物学故事的编纂,那只能说是简单的数据分析教程,永远不可能成为一个生命科学领域的science文章!

如果你有浑厚的生物学背景知识和讲故事的能力

这样的一个传统bulk转录组测序,就12个样品,不到一万块钱,见:明码标价之转录组常规测序服务(仅需799每个样品),数据分析呢,两个差异分析加上GSE富集分析,也就是 800块钱,明码标价之转录组下游分析仅需800元

更多分析需求,见我们的明码标价专栏:

测序1万块钱,分析800块钱,你也可以发science哦!

(0)

相关推荐

  • 0-跟着science学宏基因组-背景和数据

    写在前面 首先说几句话: 本小结代码不需要运行,只是告诉大家数据来源和这份代码的来源: 本小结的软件也不需要安装. 如果没有Ubuntu的随便安装一个就可以16-20都可以运行,例如: 下载一个Qii ...

  • 【生信笔记】高速下载测序数据:Aspera的安装与使用

    当我们需要一些NGS数据时,一般会去NCBI或者EBI的数据库中下载.但是当我们用wget下载时,时常会出现断开连接或者网络下载速度缓慢,对于几十G或者上百G的数据,下载无计可施,这是则可以使用Asp ...

  • 省事地获取已公开测序数据的下载链接(.sra|.fastq.gz)

    写在前面 课题需要,前述,在TBtools中开放了一个SraExperimentXML2InfoTable的功能.在这个功能的辅助下,我们较快的完成了阶段任务.筛选数据完成了,但是下载数据却出现了问题 ...

  • 如何高效又简单地省时地获得SRA公共数据的Fastq格式数据

    如何高效又简单地省时地获得SRA公共数据的Fastq格式数据 陈胖子 下载NCBI SRA数据库上的公共数据,整体上还是大部分搞数据分析,又想灌水的人必做的一个事情. 其实直接使用官网推荐的工具asp ...

  • 【数据库】SRA数据库介绍及数据下载

    [数据库]SRA数据库介绍及数据下载 - 目录 1. SRA数据库介绍 (1) SRP开头的ID:PRJNA = SRP (2) PRJNA开头的ID:SAMN = SRS (3) SRX开头的ID ...

  • 专四考试在即!dictée怎么练才高效?进来收获一篇听写练习干货!

    距离法语专四考试只有不到一个月的时间了,不知道小伙伴们有没有做好准备呢? 作为专四考试的重头大戏,拿下dictée可谓就是赢得了专四"开门红"哇! 然而,面对dictée,你是不是 ...

  • 亲子共读的心得及收获5篇大全

    亲子共读可以辅助幼儿识字.理解书籍.便于沟通,进行亲子共读之后,有什么读书心得跟收获呢?接下来是小编为大家整理的亲子共读的心得及收获5篇大全,希望大家喜欢! 亲子共读的心得及收获大全1 读书使人明智, ...

  • 学会这三点,你也能发篇Science!

    具备什么条件才可以发一篇Science呢? 小编将从本文解析出三个关键点,只要大家掌握了这么几点,相信各位都有机会发一篇Science. 简介 不久之前,我们介绍规模化制备过酰胺的方法大全(点击阅读详 ...

  • 怎么管理好一个工地?这篇讲得很到位!

    一个项目管理的好坏,很大程度就体现在团队的建设和管理上. 举个简单的例子:如果有一车沙从大厦顶上倒下来,对地面的冲击是不太大的,如果把一整车已凝固成整块的混凝土从大厦上倒下来,其结果就大不一样.团队管 ...

  • 第一篇SCI用了一个月,第二篇用了两个星期,第三篇用了3天时间

    本人是一名临床专业研究生(移植科),白天上班(周一到周五门诊),晚上熬夜搞科研,移植科天天忙都要命,完全都是挤时间做科研的,不信的话可以问一下移植科的朋友.我们毕业的要求就发一篇SCI即可,对期刊没有 ...

  • 养玉露教你1招,不出一个月收获50盆,简单易学,太棒了!

    我们在爱花之家等你 最开始养多肉的时候,就是玉露,玉露是我入手的第一盆植物,只养了一个月的时间就死了,原因是我经常浇水,导致玉露腐烂了,最终死亡了,后来慢慢的总结经验,终于摸索出了养多肉的技巧. 今天 ...

  • 纠结出国读研or国内考研?其实这不是一个问题,这篇文章帮你解惑

    音频版课程链接,让你解放双手,边走边听 https://www.ximalaya.com/gerenchengzhang/3341211/345514566 凡事都有解 导语:学业是人生的一件大事,如 ...

  • 水凝胶,一天 2 篇Science子刊

    奇物论 科学,需要一点好奇心~ 3515篇原创内容 公众号 生物材料学术QQ群:1067866501 1.Science Advances:超快自凝胶粉末介导强大的湿粘附以促进胃肠道穿孔的愈合 由于界 ...

  • 幸福,拐了一个弯【结局篇】

    十多天的时间,在两人满心期待与焦虑不安中,终于熬过去了,这天两人一早赶到医院拿鉴定结果.当赵姨捧起那份鉴定书,看到那一行 DNA 鉴定结果,亲权指数99.98%时,她激动地流泪了,像个不懂事的小女孩般 ...