Pubmeth:癌症相关甲基化数据库
研究过程中,也许有一个问题曾经困扰过你:“该基因是否已经在文献中描述为甲基化且属于哪种癌症类型”。虽然不难回答,但解决此类问题比较耗时,一般通过文本挖掘方法(GoldMine)可以部分解决。即便如此,自动搜索后仍需要进行大量审查工作,因此ir. Maté Ongenaert决定构建一个带有甲基化注释信息的数据库:PubMeth。
Pubmeth数据库创建于2007年4月,收集和整理了文献中与癌症相关的甲基化数据,并进行了人工校对和注释,提供了一个高质量的癌症相关的发生了甲基化基因的数据库。PubMeth包含5000多个记录,这些记录来自1000多个文献来源。
Pubmeth
http://www.pubmeth.org/
本期内容我们从Pubmeth提供的获取数据方式展开。
Search PubMeth
Pubmeth提供的获取数据方式有三种。
① 以基因为中心:
解决问题如:据报道,哪些癌症类型(和亚型)在被搜索的基因中被甲基化?
我们用浏览选择基因的方式进行查看,点击browse through genes,找到CDKN2A(例子)基因。点击可以查看如下内容。
不同癌症相关文献数量分布:
不同癌症相关文献甲基化数量分布
PS:甲基化频率取决于检测技术。
不同癌症甲基化频率:
点击如果start a gene-centric search,是搜索基因的方式,会出现搜索框:
在框中插入基因符号(HGNC),别名或标识符(Ensembl,RefSeq,Entrez基因),然后单击提交即可。如果您用seach术语拾取了多个基因,则会显示一个列表。这里我们通过输入CDKN2A基因,可以发现该基因被描述为甲基化的癌症类型。
点击后会出现提示:
Now processing your request:
A list of possible genes will be created
This can take up to 20 seconds per gene, so please be patient; page will automatically refresh;
官方提示此时耐心等待就好,一般最多需要等20s。(但是实际上并不一定,有可能更久……)
基因为中心检索的优点是预先计算所有内容即可快速浏览,只需浏览即可发现。缺点是可能会没有感兴趣的基因的概括概述,用户可能会迷失太多(级别)的信息。
② 以癌症为中心:
解决问题如:在某些癌症类型/癌症亚型中,哪些基因被甲基化?
第一种是从所有可用的癌症类型中选择,指定感兴趣的癌症(亚)类型,查看一种主要癌症类型之间或不同类型之间的差异。
比如我们选择lung ,然后拉到最下方点击submit进行提交即可。
如果搜索的话,直接在搜索框输入癌症名点击提交即可。
优点是重点突出,仅出现包括感兴趣的癌症(亚)类型;总结观点是很好的指导;与以基因为中心的浏览链接,可快速切换癌症基因。缺点是不如以基因为中心的浏览速度快;详细视图不会将子类型分组;列出了所有癌症类型,需要滚动查找相关的癌症类型。
注意:超过3天的结果将从服务器中删除。
③ Combined
最后,经过两种方式的比较,网站给出了第三种方式--组合搜索:查看您感兴趣的哪些基因在感兴趣的癌症(亚)类型中被甲基化。
另外如果在使用过程中发现PubMeth中缺少数据or您是癌症中与甲基化相关的文章的作者,但没有在PubMeth中列出or进行了文献搜索,PubMeth中没有收录参考文献,此时,我可以通过填写以下表格来完善~
综合起来看,还是浏览基因甲基化的方式最快,其他的方式搜索获得数据速度有些随缘,今天就介绍这么多啦,完结,撒花~
END