生信神器之一站式表达谱数据分析
表达谱数据分析的时候,经常包括各种各样的分析。比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等。NetwordAnalyst(https://www.networkanalyst.ca/)是一个一站式分析转录组数据的数据库。在这里我们可以分析常见的一些分析。
基本介绍
数据库一共包括 五种分析方式:
输入网络数据:比如从蛋白相互作用数据库下载下来的网络对应数据来进行可视化。其实功能类似于简易版的
cytoscape
。下图就是输入数据后得到的默认网络。gene list input
:如果我们已经有目标基因了,需要进行富集分析;蛋白相互作用分析等。同时我们也可以输入多个数据集的结果,然后得到venn图相关的重叠结果进行分析。Gene Expression Table
: 我们来输入RNA-seq或者microarray的表达矩阵,来进行下一步分析。Raw RNA-seq Data
: 输入RNA-seq的 fastq格式的数据来进行下游分析。Multiple Gene Expression Tables
: 输入多个数据集的表达矩阵,来对多个数据集进行整合的分析。
由于网站的功能很多,但是后续分析的结果类似,所以我们就用Multiple Gene Expression Tables
来进行演示。
Multiple Gene Expression Tables
数据输入
点击Multiple Gene Expression Tables
后,我们可以看到这样上传数据的界面。上传的表达矩阵的样本不能大于1000。
我们通过点击Add New
来上传表达矩阵。表达矩阵应该是是这样的一个格式。
第一行是样本的变化,同时用 #
来增加一个NAME
的表示代表第一列为基因名。
第二行是本次实验设计的分组。
后面的行数则为表达矩阵,第一列是基因ID。
PS:
我们使用实例文件来进行分析,实例文件包括三个数据集,两个RNA-seq以及一个芯片数据。
上传数据完成后,点击Proceed
下一步。这里会提示我们是否想要下载一个融合的数据集,如果想要下载的话,可以点击Download
。我们点击Next
可以进行下一步
质量评估
分析的第一步就是对数据进行质量评估,评估每个样本的分布,这个网站提供了两种对于样本评估的方式。PCA图
和密度图
同时网站还提供了,对于不同数据集进行batch effect
批次效应的矫正。
通过通过矫正完,可以看到矫正完的PCA图
和密度图
。
进行批次效应完事儿,我们点击Proceed
。
荟萃分析
通过完质量评估,并且去掉批次效应后,我们可以进行荟萃分析来结合不同数据库的结果来得到重叠的结果。数据库提供了不同的进行数据结果融合的方法,同时也给了推荐指数。
我们选择第一个点击submit
,然后点击Proceed
。
差异基因
通过上面两部,我们可以得到差异表达基因。
同时我们点击View
可以看到这个基因在每个数据集当中的变化。
接下来我们点击Proceed
。
下游分析
在下游分析中,网站给了现有的一些常用的分析。这些平时我们都是通过不同的软件来做的,但是这个网站整合到一起了。
PS:而且用一种正确的方式整合到一起了。(真的会有人会用差异分析的结果去做GSEA的)。
由于分析的结果较多,我们以Netword Visual Analytics
来对来对其中的结果进行说明。剩下的大家可以自己去点点看。点击Netword Visual Analytics
后,会让我们来选择用什么数据集。我们可以选择重叠的数据集也可以选择各自的数据集。我们选择融合的数据集。
点击完后,我们可以看到,很多目前文章里面做的网络都可以进行做。其中包括·蛋白相互作用分析(PPI)
; 转录调控网络
; 疾病/药物相关网络
;共表达网络
而且网站对于一个分析也有很多其他的数据库可以选择。例如基因的蛋白相互作用(Generic PPI)
。就可以选择string
或者IMEx
数据库。
我们选择好点击OK
后,即可得到。对于网络的分析的一个初步的结果
下载
所有分析的结果,我们都可以下载下来
PS:其实目前很多基础的芯片数据分析的文章用这个网站就够了。而且方法也对,不会让一些不是很懂用法的虽然使用分析方式。当然同样的,这些也是最基本的分析方法,特别的还是需要自己分析的。