人类染色质开放状态数据库

对于转录因子预测而言,我们昨天的数据库介绍当中也提到了。转录因子主要是通过识别DNA序列当中的基序(motif)来调控目标基因的。所以其实我们在知道了一个基因的motif的时候就差不多能找到这个转录因子都和哪些位置结合了。但是对于预测的结果和现实还是有区别的。因为真核生物的核DNA并不是裸露的,而是与组蛋白结合形成染色体的基本结构单位核小体,核小体再经逐步的压缩折叠最终形成染色体高级结构。只有当DNA复制的时候,核小体才会打开,进而转录因子这些的才能进行调控。这部分打开的染色质,就叫开放染色质,打开的染色质允许其他调控因子结合的特性称为染色质的可及性(chromatin accessibility)。

因此对于预测一个转录因子调控的话,需要在其开放染色质的基础上预测到的结果才算是准确的。所以今天就介绍一个预测人类染色体开放状态的数据库: ATACdb[http://www.licpathway.net/ATACdb/index.php].

背景数据介绍

对于预测染色质可及性的而言,目前有多种高通量的技术可以做到,比如:ATAC-seq, DNase-seq, FAIRE-seq 和 MNase-seq等等。在这些技术当中,ATAC-seq不管是在性价比还是在敏感性上都是很高。所以目前使用ATAC-seq来进行检测的数据也就越来越多。正是由于这样的数据越多越多,所以作者就把目前网上的所有的能收集到的ATAC-seq的数据都统一下来下来按照统一流程进行分析。最后利用分析的数据构建了这个ATACdb数据库。

数据库使用

这个数据库多种检索的方式来让我们获取数据库当中的结果,主要有:所有数据浏览、检索功能、分析功能以及数据下载功能。

数据浏览

在数据浏览的地方,我们可以查看这个数据库具体纳入了哪些ATAC-seq的数据。

同时点击具体的Sample ID就可以获得这个样本ATAC-seq的所有结果了。

目标检索

在目标检索的模块当中,我们可以基于我们自己的研究目的来进行检索。这样来获得相关的结果。网站一共提供了四种检索方式:转录因子检索、目标基因检索、基因组位置检索以及相关组织检索。

例如我们想要检索转录因子调控的区域的话,首先数据库会给一个简单的说明,让我们具体的分析过程。剩下的,就是我们输入自己想要检索的转录因子即可。这里我们输入: EGR1.

在分析结果里面,我们可以和转录因子相关的总体的情况,以及其可能结合的区域。

分析功能

分析功能这个方面,我们可以来分析两个不同的组织来源的细胞测序结果,进而比对寻找其差异或者重叠的区域。也可以寻找两个转录因子共同重叠的区域。

数据库使用场景

以上就是这个数据库的基本内容了,主要是基于ATAC-seq来构建的和染色体开放有关的数据库。同时也可以用来预测转录因子结合。对于研究染色质开放情况以及转录因子的都可以来查询一下。

同时如果想要ATAC-seq的数据,但是有不会分析,这个数据库提供了分析文件的地方,这样就可以下载下来直接使用结果了。

(0)

相关推荐