多组学在线分析工具
随着高通量测序技术种类的越来越多,我们经常会拿到相关样本的不同组学的数据。那拿 TCGA 的数据库而言,对于同一个患者,就检测了RNA-seq, miRNA-seq, 甲基化芯片等等多组学的数据。对于这样有多组学数据的情况,除了基本的单一组学的分析,也可以尝试着融合多个组学一起分析。所以,今天就介绍一个多组学分析的工具。OmicsAnalyst (https://www.omicsanalyst.ca/OmicsAnalyst/home.xhtml)
OmicsAnalyst 使用
数据上传
在进入 OmicsAnalyst 的网址之后,我们点击其中的 GET STARTED 就可以使用进行分析了。由于是从开开始分析的工具,所以第一步也就是来上传原始数据。在 OmicsAnalyst 当中主要支持五种高通量测序的数据分析。在数据上传的同时,OmicsAnalyst 还对上传的数据进行了一些简单的处理比如:缺失值处理,低表达数据过滤,组间分析
由于也是在线工具类的,不会特别的智能,所以也一定要满足这个工具的要求。具体的上传的数据格式可见:https://www.omicsanalyst.ca/OmicsAnalyst/docs/FaqView.xhtml
这里我们使用tcga数据库当中的RNA-seq以及miRNA-seq数据进行后续分析。
数据质量检查
对于上传的数据,第一步也是要对上传的数据来一个整体的观察。探索性数据分析的话,一般也就是来看一下数据分析以及通过降维分析来观察数据之间的分组分布。在 OmicsAnalyst 当中,我们可以观察数据的密度分布以及通过 PCA以及t-SNE 来观察降维之后各个样本的分布。
以上就是简单的观察上传的数据的分布,并不能通过观察之后如果发现批次效应之后进行批次去除。所以建议这里上传去除批次之后的数据。关于批次效应的去除可以查看:[[批次效应去除工具]]
结果展示
相关网络构建
对于不同组学之间的关联性分析,可以通过相互作用网络来进行构建。具体的过程主要是先通过单变量或者多变量分析来选择差异特征(基因)。进一步对不同组学当中有差异的特征进行相关分析。
在进行的计算过程中,包括了多种进行相关分析的算法来进行分析。
经过分析。就可以得到不同组学当中的的相关网络了。
聚类热图分析
在这个分析结果当中,可以观察基于多组学的数据各个样本的聚类分析的结果。这样的结果可以用来当作多组学的分子分型。
在聚类热图当中,除了可查看不同基因的聚类结果。同时也可以对这些基因结果进行富集分析。进一步如果有感兴趣的通路也可以标注在热图上。
降维分析
之前的质量评估的时候,通过降维分析来了解不同组学的数据特征。现在的降维是在多组学数据融合的基础上来进行降维的。
最后可以在一个三维的散点图上观察降维分析的结果。
总的来说
以上就是这个工具的主要使用过程了,OmicsAnalyst 主要还是用于对多组学的数据联合分析的时候,寻找多组学之间的联系(相关分析)或者通过聚类来寻找相关的多组学基因分型的时候可以使用。
另外,如果是单一组学的常规分析的话,可以使用[[Quickomics-表达谱数据一站式分析工具]]
另外关于这个数据库的作者,作者目前已经开发了很多流程化分析的工具,涉及到多组学的各个方面。之前我们介绍的:
[[NetworkAnalyst-一站式表达谱数据分析]]
[[MetaboAnalyst-代谢数据分析数据库]]
[[miRNANet-综合性miRNA靶基因预测数据库]]
都是出自作者团队。有兴趣的可以了解一下。
最后,如果是想要 TCGA的数据库进行聚类分析的话,则可以使用[[COMSUC-在线聚类分析工具]]这个工具直接进行。