SBC miRNA测序数据分析 - 丁香通

数据分析内容

1) microRNA长度分布统计以验证试验可靠性
应用fastx(fastx_toolkit-0.0.13.2)对测序原始reads进行预处理,去除接头序列以及低质量序列。

图为经过长度统计,各长度上序列的分布情况

2) 比对注释
将测序得到的序列与miRBBase以及其他非编码数据库ncRNA,pirna,Rfam数据库里的序列进行比对,对已知microRNA进行注释:
下图为经过注释的结果,其中分别列出和miRBase数据库,pirna数据库,Rfam数据库以及ncRNA数据库的比对情况。

下图为针对miRBase种Sus scrofa物种进行的比对注释统计:

由之前所得的注释结果,可以作图来更进一步展示其结果:

对整体的注释结果,还可以采取进一步的分析,例如:

(1) 统计碱基偏好性,下图就是测序所得序列分别在21,22,23,24长度上的5’碱基分布情况。

2) 对于测序所得序列,可以统计出其正负链分布情况,以找寻生物学上的特征。

针对某单一microRNA,也可以对其进行更深度的分析。
例如,对其序列的匹配情况进行分别统计:

还可以对其对应的microRNA前体二级结构进行观察。

3) 分类注释

将测序得到的序列与物种所对应的基因组数据库比对,对有注释的reads的来源进行分类统计,鉴定并统计出已知的microRNA以及各种不同种类的RNA分子。
如图,经过与数据库进行分别比对,可以鉴定并统计出包括tRNA,rRNA,snoRNA,snRNA的数量及分布。

4) 差异分析

我们采取用DEGseq R语言包结合perl脚本将样品按照客户的分组情况,进行表达量的比较分析。
在差异分析中,我们会采用TPM(Transcripts per million,公式为:单一miRNA reads数×106/总reads数)作为标准化数据。

结果展示如下:

5) 饱和度分析

将注释结果按比例划分作图,以观察样品注释的趋势,发现其在生物学上的合理性。

6) 新microRNA预测

对于未注释上的序列,我们将其与该物种全基因组序列进行比对分析,通过折叠模型预测新的microRNA,通过折叠模型分析,若有序列位于茎环结构上,则初步判定该序列为一个候选的新microRNA。

对于预测出的新microRNA,我们会统计并列出其所位于的染色体,起始位置,终止位置,正负链,以及数目,长度,GC含量,最小自由能等数值。

对于新microRNA,我们还会计算并绘制出其前体的二级结构,以及其与成熟microRNA之间的位置关系。

7) mircoRNA作用靶基因预测:

采用miranda软件,对microRNA序列以及对应物种的基因组cDNA序列进行可能的靶位点预测
Miranda软件比对结果示意图如下:

(0)

相关推荐

  • IGV-sRNA - 植物小RNA测序数据专用基因组浏览器

    如本期推文,我们开始对外共享三年多以来的部分工作成果,即 sRNAanno  - 一个植物小RNA注释数据库 ( www.plantsRNAs.org ).在这个数据库中,用户可以但不仅限于: 下载1 ...

  • miRNA测序技术原理

    miRNA测序背景简介 小RNA是生物体内一类具有重要调控功能的非编码短小RNA的总称.大量研究已经证实,小RNA几乎参与调控了动植物所有的生命过程,包括细胞增殖,分化,凋亡等,并且与人类疾病的发生发 ...

  • TargetScan: miRNA靶基因数据库

    导语 TargetScan是一款预测miRNA结合位点的软件,对于哺乳动物中miRNA结合位点预测的效果非常好.在预测miRNA靶基因之前,首先需要确定转录本的3'UTR区域,TargetScan数据 ...

  • miRNEST:动植物多物种miRNA数据库

    miRNEST是一个整合了动物,植物和病毒microRNA数据的综合数据库,这是一个集成的microRNAs资源.该数据库由波兰Adam Mickiewicz大学 Izabela Makałowska ...

  • 最强攻略2: 史上最全非编码RNA数据库汇总解读

    第一单元 lncRNA数据库 长链非编码RNA(Long non-coding RNA, lncRNA)是长度大于 200 个核苷酸的非编码RNA.研究表明, lncRNA 在剂量补偿效应.表观遗传调 ...

  • 【科研】转录组测序数据分析

    引言 前面两期主要为各位简单介绍了转录组测序以及转录组测序的方法,相信各位对转录组测序有了一定的了解.那么测序后进行数据分析,具体包含哪些分析内容呢?本文就详细为各位介绍一下. 分析内容 mRNA是具 ...

  • 肿瘤全外显子测序数据分析流程大放送

    这个一个肿瘤外显子项目的文章发表并且公布的公共数据,我这里给出全套分析流程代码.只需要你肯实践,就可以运行成功. PS:有些后起之秀自己运营公众号或者博客喜欢批评我们这些老人,一味的堆砌代码不给解释, ...

  • 人类全外显子测序数据分析视频教程学习笔记

    耗费半年的时间精心制作了成套的生物信息学入门视频教程,并且在生信技能树联盟平台发布了这个长达74个小时全套生物信息学入门视频:生信技能树视频课程学习路径,这么好的视频还免费! 在B站看了看,大家学的热 ...

  • 使用bamdst完成公司外显子测序数据分析报告的重要环节

    目前主流的ngs科研服务,包括WES和RNA-seq价格都是透明的,反正建库四五百块钱,测序都是60元一个G左右,也就是说10G数据量的wes也就是一千块钱,同理RNA-seq也是如此,而且有趣的是标 ...

  • 0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》

    早在2015年,那个我进入生信领域还不满两年,就看到了新闻,说百度CEO李彦宏将个人捐赠3000万元,支持百度与北京协和医学院针对食管癌基因组研究的合作. 当时的我仅仅是把它当做了新闻看了看,具体的合 ...

  • 综述:高维单细胞RNA测序数据分析工具(上)

    文章信息 Author:Yan Wu and Kun Zhang Date:2020 Mar 27 Journal:Nat Rev Nephrol(IF:19.684) 摘要 在单细胞水平上对转录组进 ...

  • 综述:高维单细胞RNA测序数据分析工具(中)

    当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步.不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长. 文献速递栏目通过简 ...

  • 综述:高维单细胞RNA测序数据分析工具(下)

    当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步.不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长. 文献速递栏目通过简 ...