如何根据转录因子预测靶基因?
我们以前写过如何寻找基因的启动子和预测转录因子:(工具篇):如何查找基因的启动子及预测转录因子?,今天我们反过来做一个事情:根据转录因子来预测靶基因。
其实我们知道很多转录因子的结合序列是相对保守的,这样我们就可以根据保守的序列进行预测,但是由于一般序列比较短,所以会预测到很多靶基因,这时我们一般通过CHIP-qPCR来反过来进行验证。好下面我们来介绍这个数据库:
GTRD (Gene Tranion Regulation Database):http://gtrd.biouml.org/
我们可以直接通过单击Start开始:
界面右侧的红框里面是我们可以设置的。这里我们直接举例说明,比如我们想完成两个事情:
(1)看lncRNA HOTAIR基因上转录因子SMAD1的结合情况;
(2)预测转录因子SMAD1的靶基因;
(1)我们在advanced search中输入物种、dataset、cell line、treatment、max gene distance和output type分别如图:
然后单击Run,在新打开的界面中可以看到HOTAIR和SMAD1的结合位点:
我们可以单击TF binding sites:open table:
查看具体信息:
如果我们想看所有转录因子的情况,在前面tranion factor里面选择any即可:
这样我们就可以同时看到转录因子结合位点与峰高(peaks)了:
(2)预测SMAD1的靶基因:
直接在advanced search里面选择SMAD1,
单击Run:
上图红框就是预测到的靶基因,结果可以导出:
选择导出格式:
我们看到一共有33522条:
这是导出的结果:
我们可以通过ID转换工具进行转换,方法见这两篇文章:
转换过后的格式是这样的:
网站是好用,就是太多了,最后还是要结合ChIP-seq的数据来看