EWAS Atlas | 甲基化状态查询数据库
这两个都是我们国家基因组科学数据中心发表建立的两个数据库。不同的是EWAS Atlas主要是基于甲基化相关的分析查询的,另外的EWAS Data Hub则是专注于下载具体的甲基化芯片的数据结果,所以其实我们主要能用到的还是EWAS Atlas的这个数据库。
关于这个数据库的纳入的信息,我们可以从下图看到,这个数据库纳入了306种疾病,其中的数据主要来自于GEO数据库以及TCGA的数据。至于甲基化芯片的类型,主要还是450K的芯片为主。
同时由于我们知道表观遗传的调控和生活事件是有关系的。所以关于检测样本的有的生活时间数据库也纳入了进来,比如吸烟、年龄等。
关于EWAS Atlas的检索,这个数据库提供了三种检索方式:样本特征(吸烟、疾病等)、基因名或者cg探针。关于cg探针的介绍,可以查看我们之前的帖子。
这里,我们输入AHRR这个基因当作检索基因。
首先我们可以看到关于这个基因在数据库当中的基本信息,其中包括关于这个基因其中的甲基化芯片检测的位置位于什么地方,基因是高甲基化还是低甲基化的,以及相关的临床特征。
由于一个基因会有很多的cg探针。所以我们可以在Probes里面查看具体某一个探针的结果。
进一步的,我们可以看到相关甲基化测序的研究结果以及和这个基因甲基化有关的文章。
除了最基本的检索功能,这个数据库也提供了,多甲基化位点的关联分析。这个部分主要包括两个具体分析的功能:富集和注释、网络可视化。
网络可视化
这个部分主要就是通过把之前的检索的结果通过网络分析的过程展现出来。我们可以数据样本特征或者相关的基因都行。例如我们数据: gastric cancer。
在这个网络图当中,绿色的代表我们检索的中心关键词,红色的是基因,黄色的是相关的临床特征。通过这个网络图我们就可以看到在甲基化相关数据中和胃癌有关的信息了。
富集和注释
如果我有一些目标的cg探针。我想要了解这么目标cg探针的功能和信息的话,可以使用这个功能。在这个功能当中,我们需要做的就是数据目标cg探针即可。当然如果我们有目标的样本特征,也可以输入。
主要结果的话,我们可以看到以下这个结果信息。所有的结果一般都是通过一个图和一个表来进行展示的。
目标cg探针和样本特征的关系
目标cg探针在基因组当中的位置
目标cg探针所设计的基因的富集分析的结果(GO分析和KEGG分析结果)
目标cg探针和染色质状态以及组蛋白修饰的关系。这一部分的结果是来来自于Roadmap Epigenomics Project分析的结果。
每一个输入的cg探针对于甲基化的影响以及对于表达的影响。
输入的cg探针可能影响的转录因子以及其转录因子结合的位点motif。
至此这个数据库的基本功能就介绍完了。相比较之前的甲基化数据库而言这个纳入的数据量会大很多,但是分析的类型就各有各的好处了。大家可以基于自己的目的来选择目标数据库即可。