研究癌症突变,这个数据库太太太太太太有用了!
对导致癌症起始和进展的基因事件的探究与理解,至今仍然是癌症生物学的巨大挑战。2020年11月12日,中南大学生命科学学院,中科院北京生科院,武汉大学人民医院,北京大学第三医院等国内医学单位,携手于Nucleic Acids Research(IF:11.5)发表了标题为OncoVar: an integrated database and analysis platform for oncogenic driver variants in cancers的文章。
![](http://n4.ikafan.com/assetsj/blank.gif)
值得注意的是,该研究将所有结果以用户友好型方式共享在数据库OncoVar(https://oncovar.org/)上,从而使得方便地检索TCGA和ICGC项目中的驱动基因注释成为可能。这一事件也全面拉开了系统性评估体细胞突变及原癌基因的致癌能力的序幕,提高了在泛癌中识别肿瘤驱动相关因素,进而应用于精准医疗的可行性。(这段文字,需自动配谍战片中打字机的声音~)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
基于对TCGA中33个癌种的10,769个外显子数据,及ICGC中18个癌种的1,942个基因组数据的重分析,最终获取20,162 个肿瘤驱动突变,814 个驱动基因, 2,360个疾病相关通路。
![](http://n4.ikafan.com/assetsj/blank.gif)
且这些数据均可以友好的在数据库中进行下载。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
1.该数据库可进行癌症/突变/基因/通路,4个层面的检索。
(1)癌症
可以在首页直接点击对应癌症图标
![](http://n4.ikafan.com/assetsj/blank.gif)
或者点击导航栏中的“Cancer”搜索,随后选择具体的数据来源及疾病类型。
![](http://n4.ikafan.com/assetsj/blank.gif)
即可查看疾病相关的突变位点/突变基因/通路,图片均可下载。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
(2)突变/基因/通路
同理,可以进行其他层面的检索
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
更详细的操作说明,详见https://oncovar.org/welcome/docs
2.在线分析
该数据库支持上传自己的数据,进而进行突变注释/功能富集/不同基因组版本之间的突变信息转换。
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
![](http://n4.ikafan.com/assetsj/blank.gif)
(1)低成本薅羊毛的,在文章写作时,若目标基因属于该数据库所报道的驱动基因,可以加以讨论,恭喜你又多了一条证明你所关注的基因真的很重要的证据。
(2)中等成本薅羊毛的,如我,可以将该数据库所整理的驱动基因list或者疾病相关pathway,当作分析中的起始输入文件,再结合常规套路分析,引言中直接引用这篇11分的文献进行说明为什么要关注这些基因或者通路。
(3)高成本薅羊毛的,回归到作者的初衷,可以辅助进行精准医疗相关的研究。
(4)我期望的薅羊毛方式,可以基于该数据库的在线分析,找出两组样本间差异的驱动基因/突变频率差异的基因。
更多脑洞大开的idea欢迎在评论区进行讨论。
若有数据库升级建议,也可直接联系开发者(i@tania.wang),鉴于这是国人开发的数据库,邮件可以用中文~~根据我收到邮件回复的时间推算,一般会在一个小时左右收到回复,惊不惊喜,这可能是我遇到的邮件回复效率及问题解决效率最高的数据库了。
![](http://n4.ikafan.com/assetsj/blank.gif)