Pubmeth:癌症相关甲基化数据库

研究过程中,也许有一个问题曾经困扰过你:“该基因是否已经在文献中描述为甲基化且属于哪种癌症类型”。虽然不难回答,但解决此类问题比较耗时,一般通过文本挖掘方法(GoldMine)可以部分解决。即便如此,自动搜索后仍需要进行大量审查工作,因此ir. Maté Ongenaert决定构建一个带有甲基化注释信息的数据库:PubMeth。

Pubmeth数据库创建于2007年4月,收集和整理了文献中与癌症相关的甲基化数据,并进行了人工校对和注释,提供了一个高质量的癌症相关的发生了甲基化基因的数据库。PubMeth包含5000多个记录,这些记录来自1000多个文献来源。

Pubmeth

http://www.pubmeth.org/

本期内容我们从Pubmeth提供的获取数据方式展开。

Search PubMeth

Pubmeth提供的获取数据方式有三种。

① 以基因为中心:

解决问题如:据报道,哪些癌症类型(和亚型)在被搜索的基因中被甲基化?

我们用浏览选择基因的方式进行查看,点击browse through genes,找到CDKN2A(例子)基因。点击可以查看如下内容。

不同癌症相关文献数量分布:

不同癌症相关文献甲基化数量分布

PS:甲基化频率取决于检测技术。

不同癌症甲基化频率:

点击如果start a gene-centric search,是搜索基因的方式,会出现搜索框:

在框中插入基因符号(HGNC),别名或标识符(Ensembl,RefSeq,Entrez基因),然后单击提交即可。如果您用seach术语拾取了多个基因,则会显示一个列表。这里我们通过输入CDKN2A基因,可以发现该基因被描述为甲基化的癌症类型。

点击后会出现提示:

Now processing your request:

A list of possible genes will be created

This can take up to 20 seconds per gene, so please be patient; page will automatically refresh;

官方提示此时耐心等待就好,一般最多需要等20s。(但是实际上并不一定,有可能更久……)

基因为中心检索的优点是预先计算所有内容即可快速浏览,只需浏览即可发现。缺点是可能会没有感兴趣的基因的概括概述,用户可能会迷失太多(级别)的信息。

② 以癌症为中心:

解决问题如:在某些癌症类型/癌症亚型中,哪些基因被甲基化?

第一种是从所有可用的癌症类型中选择,指定感兴趣的癌症(亚)类型,查看一种主要癌症类型之间或不同类型之间的差异。

比如我们选择lung ,然后拉到最下方点击submit进行提交即可。

如果搜索的话,直接在搜索框输入癌症名点击提交即可。

优点是重点突出,仅出现包括感兴趣的癌症(亚)类型;总结观点是很好的指导;与以基因为中心的浏览链接,可快速切换癌症基因。缺点是不如以基因为中心的浏览速度快;详细视图不会将子类型分组;列出了所有癌症类型,需要滚动查找相关的癌症类型。

注意:超过3天的结果将从服务器中删除。

③ Combined

最后,经过两种方式的比较,网站给出了第三种方式--组合搜索:查看您感兴趣的哪些基因在感兴趣的癌症(亚)类型中被甲基化。

另外如果在使用过程中发现PubMeth中缺少数据or您是癌症中与甲基化相关的文章的作者,但没有在PubMeth中列出or进行了文献搜索,PubMeth中没有收录参考文献,此时,我可以通过填写以下表格来完善~

综合起来看,还是浏览基因甲基化的方式最快,其他的方式搜索获得数据速度有些随缘,今天就介绍这么多啦,完结,撒花~

Research:
Maté Ongenaert, Leander Van Neste, Tim De Meyer, Gerben Menschaert, Sofie Bekaert, and Wim Van Criekinge
PubMeth: a cancer methylation database combining text-mining and expert annotation
doi:10.1093/nar/gkm788

END

撰文丨生信花花
排版丨西西
值班 | 小太阳
主编丨司马牧野
(0)

相关推荐

  • 单细胞转录组聚类后的细胞类群如何查找数据库来定义

    不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了五个小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,包括5个栏目: 文献速递(简短介绍,扩充知识面) 文献 ...

  • 使用MethylMix包识别甲基化驱动的癌症基因

    真正做生信工具(R包,软件,网页)的很少,但是需要用工具的却超级多,比如:GEPIA2详解(中国智造-肿瘤数据库),主要是看表达量和生存,引用就是(1659+130),再比如GDCRNATools这个 ...

  • 识别癌症甲基化驱动基因

    MethylMix: an R package for identifying DNA methylation-driven genes. 本文参考:识别甲基化驱动的癌症基因 GetData函数,怎么 ...

  • 聊着天就把分析给做了

    之前我们介绍过一些用来预测基因在肿瘤当中表达情况的数据库.例如,GEPIA.UALCAN这些的.这些的数据库主要是通过输入目标基因,同时点击想要进行分析的模块就可以返回相关的结果.如果厌倦了点点点的话 ...

  • MethyCancer:癌症相关甲基化基因数据库

    导语 癌症被列为所有人类疾病中最致命的杀手之一.研究表观遗传修饰的改变模式,最重要的是是弄清DNA甲基化事件如何调节癌基因激活,肿瘤抑制基因沉默和染色体不稳定性,在肿瘤发生中起关键作用. 人类DNA甲 ...

  • RMVar:m6A修饰相关甲基化数据库

    m6A是mRNA上最丰富的甲基化修饰,是RNA中腺嘌呤(A)上第6位N原子上的甲基,主要存在于mRNA的CDS区和3'UTR区,影响mRNA的稳定性,翻译效率,可变剪接和定位等.此外,长非编码RNA以 ...

  • 疾病相关甲基化分析数据库

    当我们拿到一个基因,常规分析它的高低表达及功能后,还能从哪方面入手呢?大家都知道DNA甲基化修饰在人类疾病中发挥重要作用,尤其影响癌的发生发展,所以我们可以来探讨一下目的基因的甲基化情况.之前的推荐的 ...

  • 肿瘤预后相关DNA甲基化数据库

    肿瘤预后相关DNA甲基化数据库

  • 脖子上出现这种情况,你要重视,小心跟癌症相关

    世界卫生组织调查发现,1/3的癌症可以预防,1/3的可以早发现.经及时治疗可治愈,而只有1/3的癌症不能治愈. 但一些癌症早期症状具有很强迷惑性,有些甚至会被误认为其他小病,从而耽误治疗,抱憾终生. ...

  • 喝茶不养生,还可能致癌?50万中国人研究:喝茶与多种癌症相关

    老刘67岁,参加工作后就爱上了喝茶,也喜欢研究茶文化.他看过许多关于茶的文章,都说喝茶有好处,可以降血压.防癌等,所以退休后也保持每天沏茶的习惯. "喝茶防病"的观念深入人心,有的 ...

  • 肿瘤转移相关lncRNA数据库

    肿瘤转移相关lncRNA数据库

  • 科研| CELL DEATH DIS:癌症相关成纤维细胞的脂质代谢重编程增强了结直肠癌细胞的迁移(国人佳作)

    编译:阿温,编辑:谢衣.江舜尧. 原创微文,欢迎转发转载. 导读 癌症相关成纤维细胞(CAFs)与结直肠癌(CRC)细胞之间的代谢相互作用在CRC发展中起着重要作用.然而,关于脂质在CAFs中的变化以 ...

  • 晚期癌症相关症状的用药

    晚期肿瘤常常会出现影响生活质量的一些症状,如疼痛.食欲减退.恶病质.焦虑.便秘.谵妄.抑郁.腹泻.呼吸困难.乏力.呃逆.失眠.口腔问题.恶心.呕吐.多汗.终末期烦乱不安.终末期呼吸问题等等,妥善处理是 ...