Analysis of RNA-Seq Data

前面介绍了NBIS的单细胞数据分析研讨会,其实他们也有转录组学分析研讨会。大家感兴趣的话,也可以看下。

官方链接 :https://nbisweden.github.io/workshop-RNAseq/2011/
代码在 :https://github.com/NBISweden/workshop-RNAseq

主要内容

基础介绍

  • 简要介绍RNA和RNA-Seq技术的世界
  • 使用Unix/Linux命令行和使用远程计算集群Uppmax的入门读物
  • 基本的R语言学习(RNA-Seq分析通常是用R编程语言进行的,学习一些基本的R是很有用的)
  • 介绍RNA-SEQ分析所需的支持数据的检索。其中包括基因注释ID,如EnSembl ID和Gene  ID之间的转换、GO注释和转录ID。以及如何从EnSembl检索基因组数据

注以上内容原链接都有对应的PPT展开介绍

主要的实践

Data

在大多数练习中,我们将使用数据集 GSE131032 。Czarnewski et al (2019) Nat Comm(https://www.nature.com/articles/s41467-019-10769-x).

通过无偏见的方式阐明哪些基因和途径在小鼠结肠炎之后的组织再生阶段有不同的调控。特别是,我们利用了广泛使用的葡聚糖硫酸钠(DSS)诱导的结肠炎模型。这个模型是为数不多的具有先损坏后再生的特点的模型之一。因此,这个模型提供了识别再生阶段必不可少的一组基因的可能性,而再生阶段是解决炎症的关键一步。简而言之,将小鼠暴露于饮用水中的DSS 7天,然后允许其在接下来的7天内康复。在此期间,我们每隔一天收集一次结肠组织样本,然后进行RNA测序(RNA-seq)。接下来,我们对整个实验过程中的结肠样本进行了RNA-seq分析,并利用Edger计算差异表达基因(Degs),将完整的表达动力学考虑在内,以估计p值。

在本课程中,从两个实验组(第00天和第07天,每组3个样本)的数据集中抽取的FASTQ文件将在read mapping, transcript assembly, visualization, quality control and differential expression中实践使用。在这些分析的基础上,可以提出许多相关的问题,从几项质量检查到理解生物标记等不一而论。

Quality control

在对映射的RNA-seq读数进行任何其他分析之前,对映射的读数进行质量控制总是很重要的,确保您的RNA-seq数据中没有任何明显的错误。

Mapping

介绍如何使用STAR和HISAT2将reads比对到参考基因组

Post-alignment QC

比对后,将检查BAM文件中的各种比对指标。其中一些包括映射的读段数量,未映射的读段数量,读段映射到的参考中的区域,基因体覆盖率,DNA污染的迹象等。以及使用IGV可视化比对结果。

Quantification

使用featureCounts从BAM文件中量化基因计数。

Filtering & Normalisation

Exploratory data analyses

在开始任何定量分析之前,进行一些探索性分析以获取样品之间的相似性很重要。这是识别标记错误的样品,劣质样品和/或重复性差异很大的重要步骤。本节将对探索性分析PCA和层次结构聚类进行更深入的研究。

Differential gene expression

找出在我们的实验设计时间点之间存在差异表达的基因

Functional analysis

我们将对差异表达的基因进行功能分析,将它们放入功能上下文中,并可能解释DE的生物学后果。所涉及的方法有GSA(基因集分析)和GSEA(基因集富集分析)。

附加实践

Pseudoaligners

这是一个可供选择的步骤,而不是mapping、 PA-QC 和定量。Kallisto使用FastQ读数和参考转录组(cDNA + ncRNA)使用快速伪比对和bootstrap 复制法来量化转录本,以评估定量的准确性。Kallisto 的速度明显快于 STAR 或 HISAT2,而且内存占用很小。Kallisto生成转录计数。差异转录表达是使用Sleuth进行的,它使用bootstrap复制。

small RNA analyses

RNA-SEQ差异分析工作流程对来自果蝇的microRNA进行分析

Assembly & annotation

使用两种方法将原始测序短片段组装成转录本。使用HiSat2和StringTie进行基因组引导组装。使用Trinity 从头组装转录组。对组装的转录组进行功能注释以鉴定基因。

以上就是课程的主要内容,可以看到,几乎涵盖了转录组分析的方方面面,内容还是很丰富的,值得一看。

写在最后

关于RNA-seq的教程,生信技能树也分享了很多比如:免费视频课程《RNA-seq数据分析》

如果你也想开启自己的生物信息学数据处理生涯,但是自学起来困难重重,还等什么呢,赶快行动起来吧!参加生信技能树官方举办的学习班:

生信技能树的粉丝都知道有一个全国巡讲的良心学习班,口碑爆棚,生物信息学入门省心省时省力!先看看大家的反馈吧:

生物 | 单细胞 | 转录组丨资料
每天都精彩
(0)

相关推荐

  • RNA-seq数据分析最佳策略

    转录组测序技术 (RNA-seq) 具有广泛的应用,RNA-seq数据分析主要步骤包括实验设计,质量控制,reads比对,基因和转录水平的定量,差异基因表达,可变剪接,功能分析,基因融合检测和eQTL ...

  • 一文带你学会如何通过多维度的分析来论证同一个假设

    Multi-dimensional omics characterization in glioblastoma identifies the purity-associated pattern an ...

  • RNA seq汇总篇,一文掌握RNA seq

    RNA测序(RNA-seq)在过往十年里逐渐成为全转录组水平分析差异基因表达和研究mRNA差异剪接必不可少的工具.RNA-seq帮助大家对RNA生物学的理解会越来越全面:从转录本在何时何地转录到RNA ...

  • 科研 | Scientific Data:人肾脏单细胞RNA测序(国人作品)

    编译:贤,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 肾脏是具有许多不同功能且高度复杂的器官,肾小球和肾小管是肾单位的重要组成部分:这些结构的功能复杂性可能与其不同的细胞类型有关.目前已有研 ...

  • Single cell RNA-seq data analysis with R

    CSC – IT科学中心是芬兰国家和高等教育机构拥有的芬兰信息技术专业中心.为高等教育机构,研究机构,文化,公共管理和企业提供国际优质的ICT专家服务,以帮助客户蓬勃发展并造福整个社会. 每年,他们都 ...

  • Single cell RNA-seq data analysis with Chipster course

    这个课程中你将会学到以下内容: ·进行质量控制并过滤出低质量的细胞·标准化基因表达值·消除不必要的变异来源·选择可变基因·执行降维(PCA,tSNE,UMAP,CCA)·簇细胞·查找簇的标记基因·整合 ...

  • ANALYSIS OF SINGLE CELL RNA-SEQ DATA

    简单介绍下 <ANALYSIS OF SINGLE CELL RNA-SEQ DATA> Orr Ashenberg Dana Silverbush Kirk Gosik 02/25/20 ...

  • RNA m6A甲基化测序(MeRIP Seq)是什么?

    m6A(N6-methyladenosine,6-甲基腺苷)是真核生物中最常见最丰富的RNA修饰,作为一种可逆修饰,RNA既可以在甲基化转移酶METTL3/14 等酶的作用下发生m6A甲基化修饰,又可 ...

  • RNA免疫共沉淀测序(RIP seq)是什么?

    RNA免疫共沉淀(RNA Immunoprecipitation,RIP )是研究细胞内RNA与蛋白结合情况的技术,是了解转录后调控网络动态过程的有力工具,能帮助我们发现miRNA的调节靶点. RIP ...

  • 【SSCI语言系列8】Data analysis anddiscussion

    Data analysis anddiscussion时会用到的一些句子.部分小站君做了注释,大部分没有注释.更多内容敬请关注我们即将推出的SSCI系列课程.   #1 basic 445. This ...

  • circRNA(circular RNA,环状RNA)详解

               近年来,circRNA作为非编码RNA研究领域中的新宠,在每一个研究领域.研究方向都有发现circRNA新功能,吸引着无数科研小伙伴们的眼光聚焦于此,在心痒难耐.摩拳擦掌的同时, ...