多组学在线分析工具

随着高通量测序技术种类的越来越多,我们经常会拿到相关样本的不同组学的数据。那拿 TCGA 的数据库而言,对于同一个患者,就检测了RNA-seq, miRNA-seq, 甲基化芯片等等多组学的数据。对于这样有多组学数据的情况,除了基本的单一组学的分析,也可以尝试着融合多个组学一起分析。所以,今天就介绍一个多组学分析的工具。OmicsAnalyst (https://www.omicsanalyst.ca/OmicsAnalyst/home.xhtml)

OmicsAnalyst 使用

数据上传

在进入 OmicsAnalyst 的网址之后,我们点击其中的 GET STARTED 就可以使用进行分析了。由于是从开开始分析的工具,所以第一步也就是来上传原始数据。在 OmicsAnalyst 当中主要支持五种高通量测序的数据分析。在数据上传的同时,OmicsAnalyst 还对上传的数据进行了一些简单的处理比如:缺失值处理,低表达数据过滤,组间分析

由于也是在线工具类的,不会特别的智能,所以也一定要满足这个工具的要求。具体的上传的数据格式可见:https://www.omicsanalyst.ca/OmicsAnalyst/docs/FaqView.xhtml

这里我们使用tcga数据库当中的RNA-seq以及miRNA-seq数据进行后续分析。

数据质量检查

对于上传的数据,第一步也是要对上传的数据来一个整体的观察。探索性数据分析的话,一般也就是来看一下数据分析以及通过降维分析来观察数据之间的分组分布。在 OmicsAnalyst 当中,我们可以观察数据的密度分布以及通过 PCA以及t-SNE 来观察降维之后各个样本的分布。

以上就是简单的观察上传的数据的分布,并不能通过观察之后如果发现批次效应之后进行批次去除。所以建议这里上传去除批次之后的数据。关于批次效应的去除可以查看:[[批次效应去除工具]]

结果展示

相关网络构建

对于不同组学之间的关联性分析,可以通过相互作用网络来进行构建。具体的过程主要是先通过单变量或者多变量分析来选择差异特征(基因)。进一步对不同组学当中有差异的特征进行相关分析。
在进行的计算过程中,包括了多种进行相关分析的算法来进行分析。

经过分析。就可以得到不同组学当中的的相关网络了。

聚类热图分析

在这个分析结果当中,可以观察基于多组学的数据各个样本的聚类分析的结果。这样的结果可以用来当作多组学的分子分型。

在聚类热图当中,除了可查看不同基因的聚类结果。同时也可以对这些基因结果进行富集分析。进一步如果有感兴趣的通路也可以标注在热图上。

降维分析

之前的质量评估的时候,通过降维分析来了解不同组学的数据特征。现在的降维是在多组学数据融合的基础上来进行降维的。

最后可以在一个三维的散点图上观察降维分析的结果。

总的来说

以上就是这个工具的主要使用过程了,OmicsAnalyst 主要还是用于对多组学的数据联合分析的时候,寻找多组学之间的联系(相关分析)或者通过聚类来寻找相关的多组学基因分型的时候可以使用。

另外,如果是单一组学的常规分析的话,可以使用[[Quickomics-表达谱数据一站式分析工具]]

另外关于这个数据库的作者,作者目前已经开发了很多流程化分析的工具,涉及到多组学的各个方面。之前我们介绍的:

[[NetworkAnalyst-一站式表达谱数据分析]]
[[MetaboAnalyst-代谢数据分析数据库]]
[[miRNANet-综合性miRNA靶基因预测数据库]]

都是出自作者团队。有兴趣的可以了解一下。

最后,如果是想要 TCGA的数据库进行聚类分析的话,则可以使用[[COMSUC-在线聚类分析工具]]这个工具直接进行。

(0)

相关推荐

  • Cancers 6 |单细胞测序泛癌分析

    实体瘤肿瘤特异性免疫预后特征及其与免疫检查点治疗的关系 首先让我们通过摘要了解下这篇文章的主要内容,为了阐明免疫细胞浸润作为实体肿瘤预后标志的作用,作者分析了四个公开的单细胞RNA-Seq数据集和TC ...

  • 这篇11分文章还留了个宝藏给你

    An atlas of the aging lung mapped by single cell transcriptomics and deep tissue proteomics 联合单细胞转录组 ...

  • 转录组高级分析之融合基因

    一般来说,数据分析的任何一个点都会有成百上千个实验室在为之努力,比如比对,定量,可变剪切,融合基因这些步骤,那么同时也会有很多工具测评的文章,比如针对融合基因的随便搜一下,就可以发现下面两个: 201 ...

  • scATAC-seq3:常用工具—SnapATAC简介

    引文 之前的推文中,我们简单介绍了scATAC-seq的技术原理和发展历程.从本期推文开始,我们将分享scATAC-seq的常用工具和基本的分析流程.scATAC-seq分析工具当中,比较为人熟知的是 ...

  • 科研 | CURR OPIN BIOTECH:单细胞转录组学方法学和应用综述(1区IF:8.083)

    编译:罗睺,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 单细胞RNA测序(scRNA-seq)是研究脑和中枢神经系统(CNS)中单个细胞转录组的一种有前途的方法.这项技术充当了神经科学,计算 ...

  • 不研究肿瘤,就用不了TCGA的测序数据库,那要用啥……

    要分析测序数据,一般都会想到的是TCGA (当然GEO上也有部分的测序数据).但TCGA上只有肿瘤的相关研究,我们如想要研究其他疾病,甚至研究其他物种的测序数据, 其实可以看点别的,比如上EMBL-E ...

  • 单细胞RNA-seq数据分析最佳实践(下)

    男, 一个长大了才会遇到的帅哥, 稳健,潇洒,大方,靠谱. 一段生信缘,一棵技能树, 一枚大型测序工厂的螺丝钉, 一个随机森林中提灯觅食的津门旅客. 文章信息 Luecken MD, Theis FJ ...

  • 综述 | 沃里克大学Charlotte Rich-Griffin等:单细胞转录组学:植物功能基因组学的高分辨率之路

    编译:卡德加,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 植物功能是单个细胞在不同组织中协同作用的结果.RNA-seq测序技术和组织处理技术的进步使研究者能够捕获单细胞分辨率下的转录变化.单 ...

  • 西湖大学鞠峰组:环境宏病毒组学分析思路与常用工具

    环境宏病毒组学分析思路与常用工具 袁凌1, 2,倪艳4,鞠峰1, 2, 3 * 1 浙江省海岸带环境与资源研究重点实验室,工学院, 西湖大学, 杭州, 浙江 2  前沿技术研究所, 浙江西湖高等研究院 ...

  • 拼凑6个网页工具图表还不够那就再加上6个组学

    学TCGA数据库并不是为了发"套路"文章,那些基本上是本科生毕业设计的水准,但是阅读这样的文章的确可以很大程度上帮助大家认识TCGA数据库,主要是了解它可以做什么,比如我昨天在生信 ...

  • 工具篇丨免费神器又升级啦,代谢组学研究一站搞定!

    网站介绍 MetaboAnalyst,做代谢组学的小伙伴们必须掌握的一个网站,2009年诞生至今已在代谢组学领域牢牢扎根, SCI论文中经常引用.MetaboAnalyst界面简洁友好易上手,基本涵盖 ...

  • 无菌(GF)小鼠模型在微生物组学中的应用

    今天和大家见面的是无菌鼠. 随着基因组学.代谢组学等高通量检测技术的应用,人们逐渐认识到胃肠道微生物群存在巨大遗传多样性和代谢复杂性.这些共生细菌通过与宿主的复杂交互作用调节胃肠道的发育和功能,与营养 ...

  • 免疫组学10KIP

    免疫系统的重要性,这个自然无需多说,在免疫领域有没有类似于 TCGA 这样的组学数据库呢?免疫组学这样的数据库至少在数据挖掘上现在似乎还是并不多,第一个遇到的问题是啥是免疫组学?白介素同学的理解呢,就 ...

  • 代谢组学是什么?

    代谢组学是在基因组学.转录组学和蛋白质组学之后升起的系统生物学的一个新的平台,其定义为:定性.定量考察生物体系受到刺激或扰动后其代谢产物的动态变化,揭露机体生命代谢活动本质的科学. 代谢组学力求对生物 ...

  • 测序组学助力新的酶发现

    2020年,深度学习算法AlphaFold2在从原始序列预测蛋白质三维结构方面取得了里程碑式的成果. 宏基因组学产生的大量测序数据,让人们得已窥见未经培养的微生物的生物合成潜力.与初级代谢途径相比,参 ...

  • 外籍专家助力,这家初创欲利用AI+多组学破解免疫,并将开启全球化步伐 | 独家专访焕一生物

    AI 正在推动医疗健康领域进入数字化研发的新时代. "我们正在利用 AI 技术对复杂的免疫学数据.多组学数据进行研究和机制建模,以实现免疫系统甚至生物系统数字化.未来,数字化的生物有机会彻底 ...

  • 茶树大叶,中叶和小叶品种的代谢组学和途径变化

    Metabolomic and Pathway Changes in Large‐leaf, Middle‐leaf and Small‐leaf Cultivars of Camellia sine ...