基因组变异对于 ceRNA 调控影响的数据库

lncRNA(long non coding RNA)发挥功能的方式,目前研究最多的还是ceRNA 的功能。经典的ceRNA调控网络是通过 lncRNA-miRNA-mRNA 来构建的。这个研究思路,相对来说已经很成熟了,如果要在这个方面研究的话,其实再加一些变化可能更好一些,毕竟成熟的思路就代表创新性少一些,而如果要加变化的话,由于 ceRNA 调控的原始还是序列的结合,所以最直接能加的还是看基因组变异对于ceRNA 调控的影响。所以这次给大家推荐一个基因组变异对于ceRNA调控影响的数据库:LnCeVar

(http://www.bio-bigdata.net/LnCeVar)

1

数据库原理

所谓 ceRNA 就是一个 lncRNA 和一个 mRNA 都可以都可以结合同一个miRNA。由于 miRNA 和 mRNA 结合会抑制本身 mRNA 的表达,所以如果 lncRNA 可以结合一定的 miRNA,相当于就把 mRNA 释放出来进而促进其表达发挥功能了。

基于这个原理,这个数据库首先通过几个数据库来预测 lncRNA-miRNA 可能的调控作用(miRanda, TargetScan, RNAhybrid),进一步又使用两个数据库来预测miRNA-mRNA的相互调控作用(TarBase, miRTarBase)。这样寻找同样结合一个miRNA的 lnc 和 mRNA,那就有可能存在ceRNA调控关系,进而就获得了lnc-miRNA-mRNA的结果了。

PS:其实刚才预测lnc-mi的数据库完全可以用来预测mi-m。主要是TarBase和miRTarBase这两个数据库是基于实验结果来构建的数据库,所以结果更加准确一些。为了考虑结果的准确性就使用这两个数据库了。

作者通过以上方式构建好ceRNA调控网络之后,进一步的来了解基因组变异(SNP, 突变以及拷贝数)对于 ceRNA 调控网络的影响。对于SNP/突变对于ceRNA的影响,作者也不是简单的通过评选其结合能的变化来预测的。而是使用了一些测序的数据(千人基因组,TCGA,Cosmic),这样让结果更加的准确一些。

2

数据库使用

对于数据库的使用,如果我们有目标基因的话,那就直接检索就行了。另外这个数据库还提供了查看所有结果的方法。例如我们这里检索:TP53。

我们首先可以看到按照基因组变异分类的TP53的结果:

点击结果当中的数字,我们就可以看到相关结果的汇总了。例如我们想要查看TCGA数据库当中的突变的结果。那么就点击 41即可。点击之后,我们就可以看到具体的所有汇总信息。同时,我们也可以下载预测到的信息。另外点击每一个结果的Detail,我们就可以看到每一条结果的具体信息。

点击具体信息之后就可以看到很多相关信息的结果了:

  1. 每一个具体相关信息的汇总,以及之前时候有文献报道过相关调控信息。

  1. 突变类型改变的时候,预测到的绑定信息。

  1. 相关调控网络的功能分析的结果

  1. 相关 ceRNA 在 TCGA 当中预后分析的结果。

3

数据库总结

基本上数据库提供的信息就是这些。这个数据库也提供了下载作用数据的链接,如果需要可以去下载。另外的,由于数据库对于 ceRNA 调控网络的预测基于其他数据库的,所以其实今天也就相当于介绍了很多和miRNA相关的数据库了。

其中,miRanda 和 TargetScan 是常规用来预测 miRNA 靶标的数据库。TarBase和 miRTarBase 是两者基于收集的具有实验证据的 miRNA-mRNA 的数据库,这种数据库的结果肯定比单纯的靶标预测要准确的多。同样的,准确了也就代表都有人研究过了,可能创新性也就少了一些。而 RNAhybrid 其实是一个计算两个序列结合能的软件,这个软件是代码行的,如果没有一些 shell 技巧的话,不建议使用。

(0)

相关推荐