这题我会--如何弄清转录因子调控的基因(Cistrome DB数据库)
一个转录因子能同时控制多个基因的表达,同时转录因子的功能作用也可能受多个调控因子的影响。Cistrome DB就是这样的一个数据库,可以展示转录因子的相关调控内容。
Cistrome DB历年样本数据收录情况
Cistrome DB总共收录了30451人和26013小鼠的转录因子、组蛋白修饰和染色质可及性样本,可以说是目前最全面的研究ChIP-seq和DNase-seq的数据库。Cistrome DB由哈佛大学刘小乐教授课题组创建(之前我们介绍过她的另一个数据库:TIMER)。Cistrome DB提供检索工具,通过关键词检索或物种、来源、因子类型、一步步限定搜索范围,用户可查看详细的数据注释、分析结果和单个数据集的详细信息(数据的QC情况、motif分析结果、潜在的靶基因预测)、同时还可以在基因组浏览器中查看数据的分布及下载分析的结果文件。
Cistrome DB
http://cistrome.org/db/#/
学会使用cistrome,是每个研究转录因子路上的必备技能,所以接下来看看Cistrome DB有哪些功能吧。
01
Search
在这里我们可以搜索感兴趣的实验,细胞或组织。
如上,通过指定关键字,选择相应物种或生物来源以及要研究的因子类型。
搜索框下面下方会显示搜索结果,这里展示的默认(即使你什么都没搜)的呈现results:
每个ChIP-seq和DNase-seq样本都有一个唯一的数据集ID, Cistrome DB为每个数据集(包含手动管理的元数据)进行注释,包括物种、因素、生物来源、发布时间和处理状态。点击单个数据集可获取分析结果和质控指标,点击多个数据集可提取批量数据查看,选择感兴趣的数据集后我们可以将数据发送到genome browser(WashU Browse:、UCSC Browse)进行联合分析,如辅因子、染色质调节因子与组蛋白修饰之间的关系等。
我们点击任意一行数据集,下方都会自动更新结果说明,这里以第一个数据集为例,结果共两部分:
第一部分是Inspector:
①可视化的WashU Browse:
②可视化的UCSC Browse:
第二部分是tools,分为:QCreports,QC motifs,Get top putative targets,Check a putative target。
①质控报告:
②motif分析:
可以单击每个motif编号,查看详细motif logo:
③预测靶点及TSS分布:
④检测可能靶点:
02
Toolkit
这部分就是把我们重点介绍的内容啦,这里可以检索哪个因子调控了我们感兴趣的基因,哪个因子结合在用户的基因组区域或者和用户的peak有显著重叠。
使用方式和功能条件如下:
(1)输入基因名称, 查看有哪些转录因子可能调控该基因;
(2)输入基因组区域,查看有哪些转录因子可能结合在该区域;
(3)输入peak结果,查看哪些转录因子的结果与你的输入结果有明显的overlap,可以用于转录因子的colocation分析。
这里我们重点介绍第一种:Toolkit从基因层面回答“What factors regulate your gene of interest?”
以上面为例,输入基因GAPDH显示内容如下(因为上面只输入了一个基因,没有具体到位置,所以有多个位置选择):
这里我们选择片段:chr12:6534516:6538370:NM_001289746:GAPDH,点击continue,提供内容如下。
表格:
图表:形式①,可以选因子和生物来源:
横坐标表示调控潜势(RP),纵坐标表示不同的因子。
图表:形式②:
上图只展示前20(或更少)因子,Y轴表示样品中总peak的重叠峰比,X轴表示不同的因子,x轴上的点表示相同的因子。
可以看到,在这个功能中,我们可输入任意的蛋白质编码基因,Cistrome DB Toolkit会返回按照调控潜能排序好的转录因子列表,哪个因子结合在用户的基因组区域或者和用户的peak有显著重叠。
03
Cistrome-GO
Cistrome-GO是用于对转录因子ChIP-seq进行功能富集分析的网络服务。它有两种工作模式。如果用户同时提供了TF的ChIP-seq文件和差异表达分析文件(基于TF),则Cistrome-GO将基于两种数据类型的整合执行集成模式分析。如果我们仅上传TF ChIP-seq文件,则Cistrome-GO将以单独模式执行分析。
所以,你有转录因子ChIP-seq数据,预测转录因子功能完全可以交给Cistrome-GO做。
总的来说,通过Cistrome DB ,可以直接关键词搜索,也可以通过toolKit进行可以检索哪个因子调控了我们感兴趣的基因、结合在该区域;输入peak结果,查看哪些转录因子的结果与你的输入结果有明显的overlap,转录因子的colocation分析。Cistrome-GO还可以做转录因子ChIP-seq peak或者TF干扰表达的差异表达的功能富集分析,功能强大,下次可以用上。
Research:
Zheng R, Wan C, Mei S, Qin Q, Wu Q, Sun H, Chen CH, Brown M, Zhang X, Meyer CA, Liu XS. Cistrome Data Browser: expanded datasets and new tools for gene regulatory analysis. Nucleic Acids Res, 2018 Nov 20. Doi: 10.1093/nar/gky1094
Mei S, Qin Q, Wu Q, Sun H, Zheng R, Zang C, Zhu M, Wu J, Shi X, Taing L, Liu T, Brown M, Meyer CA, Liu XS. Cistrome data browser: a data portal for ChIP-Seq and chromatin accessibility data in human and mouse. Nucleic Acids Res, 2017 Jan 4;45(D1):D658-D662. Doi: 10.1093/nar/gkw983
END