[数据库推荐]多基因转录因子调控网络预测
我们之前做转录因子调控预测的时候,通常都是基于单一基因来做的,随着测序技术的成熟,我们在做完组学数据分析的时候,经常可以得到很多的基因。如果我们要寻找这么多基因共同转录因子的话,要怎么办呢?这次介绍的ChEA3(https://amp.pharm.mssm.edu/chea3/)就是一个预测多基因转录因子调控网络的数据库。
这个数据库整合了ENCODE;ReMap以及一些独立发表的CHIP-seq数据,同时还整合GTEx ;TCGA 以及ARCHS4内的RNA-seq数据内的转录因子共表达数据。另外还整合了Enrichr数据库内基因之间的转录因子共发生分析。利用以上数据库分析的结果,我们可以建立一个多基因转录因子调控网络。
数据输入
CHEA3
数据库数据输入很简单。这个数据库只需要输入基因名即可。由于数据库的目标是建立调控网络,所以输入基因名要大于1个基因的。
另外,这个数据库只能输入 基因名; 对于其他比如 ENSID;ENTREZID等都是不支持的。同时呢,这个数据由于对于基因名的大小写字母也没有区分。但是这个数据库背景数据还是人的数据。如果使用其他物种的可能也能得到结果,但是不一定准确。
在输入完基因名之后,我们点击提交即可。
结果展示:
表格
表格的结果当中包括:转录因子的基因名;调控的基因;来自的数据库
这个数据库由于是综合了多个数据库得到的结果,所以数据库对于RANK的排名有多种选择。默认的是Mean Rank
方式即综合多个数据库得到的平均排名。作者也做过验证发现平均排名结果更准确一些。
我们可以在数据库选择上面,选择我们想要的不同数据库结果
整体转录因子调控网络
整体调控网络是以网格的形式展示所有输入基因的相互作用。这个数据结果是基于RNA-seq数据的共表达分析得到的。我们可以通过网络图选择不同数据的结果。
我们可以通过Network Options
来调整结果的可视化。例如基于WGCNA module
来进行着色
转录因子之间调控网络
这个数据库还可以看我们得到的转录因子之间是否存在相互作用关系。进而了解在在调控网络当中的目标转录因子,是否存在调控关系。
在转录因子之间调控网络的中,鼠标放到网络节点上,还能看到具体的调控的上下游关系以及相关的数据库。
核心转录因子相关数据可视化
Bar Chart
展示了核心转录因子在各个数据库所占的比重。如果换成单个数据的话,则会展示起分析结果的P值
基因聚类分析
Clustergram
通过热图的方式来展示输入的基因在不同数据集之间的结果,同时可以对分布进行聚类。
数据库总结:
对于多基因转录因子调控网络预测而言,这个数据库由于结合了多个数据库的结果,所以准确性还是很高的。如果大家有自己的组学数据,在得到目标基因集合(差异表达基因或者富集的某个通路的基因)。想要知道这些基因共同受到那些转录因子调控。这个数据库倒是一个很好的选择。