突变对转录因子结合位点的影响
昨天我们介绍了突变对于蛋白结构的影响。对于基因突变而言,如果突变是发生在启动子区的话,那就有可能影响基因的转录因子结合,进而对于基因的表达也会产生影响。今天就给大家介绍一个预测突变对于转录因子结合位点的影响的数据库。
QBiC (http://qbic.genome.duke.edu/)使用一种新的算法来计算非编码区的突变对于转录因子结合的影响。这个数据库包括了人类600+的TF的数据。(PS: 这个数据库只是针对人的来预测的哈。)
输入
数据的输入主要分为三个部分:
突变数据的输入。这里我们可以输入
VCF
格式的突变信息。
如果对于VCF格式数据不清楚的话,也可以输入CSV或者TSV格式的突变信息。具体的文件格式如下图。
输入用来预测结合的转录因子。这里可以可以分为三种模式:可以输入某一个转录因子家族,可以输入某一个转录因子,或者自己自定义某几个转录因子。同时如果想要全部预测,可以选择Select ALL。
选择参考基因组: 不同参考基因组的对于基因的位置有一定的区别。由于我们在前面输入的基因组的位置,所以这里选择的时候要选择和自己输入数据相对应的参考基因组位置。
输出
结果是以表格的形式来输出的,每一行的数据包括多个内容。
具体突变序列的改变
基于数据库自己的算法计算的结果,其中:
Difference: 是等位基因变化后转录因子结合的差异
z-score: 对于上述结果标准后的结果,这个结果用于不同转录因子之间结果的比较
预测结果的P值
突变改变涉及到的转录因子
该转录因子基于突变的影响:影响方式分为三种,
绑定
;解绑
;有歧义
。例如unbound>bound
代表突变的改变从非绑定—绑定状态。
另外结果当中也提供了筛选的部分,我们可以筛选我们想要的结果。
数据库总结
转录因子对于基因的调控主要还是通过结合特定的基因序列来进行调控的。基因突变对于基因的序列改变就有可能使一个转录因子不结合,也会使别的转录因子结合,进而对于基因的表达就会产生影响。该数据库通过了z-score可以横向的比较转录因子的变化,如果想要看不同转录因子之间的变化产生的影响倒是可以考虑使用这个数值来进行比较。