肿瘤全面分析数据库:oncomine使用介绍

在做肿瘤研究的时候,我们现在都知道可以提前查一下基因的表达和临床特征有没有相关性 ,这样对我们的下一步实验也是一个预测的方向。经典的我们可以使用TCGA的数据来进行分析,我们之前介绍的GEPIA就可以来进行分析。但是对于测序的结果而言,其检测的结果不管是基于人种或者其他的原因,可能和我们的实验结果有可能存在偏差。这个时候其实多分析几个结果,多看个数据集的结果会更好一些。常用的数据库就是GEO了,但是使用GEO还要一个一个数据集找,这样又很浪费时间。所以有没有简单的方法呢?今天就给大家介绍一个汇总了多个癌种,多个数据集的综合性分析基因表达和临床相关性的数据库:oncomine(https://www.oncomine.org/)。

由于这个数据库还是很重要使用起来也是很简单的,所以这里就从注册账号开始,很详细的介绍一下这个数据库的功能吧。

1.  注册与登陆:

要想顺利使用Oncomine,首先得有个账号,其中免费注册仅限非营利机构邮箱(院校或科研机构)。

点击上图红色方框处Not a user? Register now!进行注册。

根据上图提示,输入相关信息,提交。要注意检查一下自己邮箱,系统会发送账号密码过来,我们使用邮件提供的账号密码登陆oncomine,系统会提示修改密码,按照指示操作即可。注意,修改密码后系统会再次发送一封确认修改密码的验证邮件,其中包含确认链接,我们必须点击链接后才可正常使用。

2.  基因表达谱差异分析

登陆账号后,选择数据集(研究对象):在左边的 “Primary Filter” 中依次选择Analysis Type →Differential Analysis → Cancer vs. Normal Analysis → Gastric Cancer vs. Normal Analysis(7)。页面自动跳转为胃癌及癌旁对照的芯片数据子集。

其中数字7代表该数据库包含7个胃癌相关相关数据集。

此处默认显示的是第一个数据子集的数据表达情况,我们可以通过选择其他数据子集来查看相应数据。详细介绍如上图所示,其中热图的每个格子代表一个样本的表达数据,鼠标置于格子上时,会显示该样本的对应数据信息。

点击研究名称(此处为Chen Gastric(132)),可以查看该研究中的数据情况,如下图。

当然,我们也可以进行多数据集整合检索基因表达差异(Meta分析)。

根据研究目的,选择数据集,比如我们这里想看一下与肠型胃癌相关的差异表达基因。勾选该数据库包含所有肠型胃癌的数据子集后,点击上方Compare按钮。

右侧页面将会显示所选数据集的meta分析结果。其中Median Rank代表中位秩,即秩的中位数。

3.  特定基因表达差异分析

Oncomine支持几乎所有蛋白编码基因,部分研究较多的非编码 RNA也能搜索到。这里我们以编码基因TP53为例,进行后续介绍。在搜索栏中输入TP53,点击搜索按钮,页面如下:

我们可以根据表格上方的筛选条件(p值、变化倍数等)扩大或缩小筛选范围。

Outlier分析是基于肿瘤异质性进行的离群值或异常值的分析,即只在肿瘤的某些亚型或特定群体中异常表达。比如10%胃癌中TP53表达显著升高,但如果是在全部样品中分析TP53的表达差异显著性,不会有显著性差异,但是仅在这10%的样品中有差异,我们可以分析这10%的样品有何共同之处,从而找出影响TP53显著变化的因素。

对于图中的小方格,蓝色代表TP53在对应的肿瘤低表达,红色代表高表达,灰色代表没有数据。其中数字表示符合筛选条件的研究数量。

鼠标置于格子上方,会显示对应的信息。点击小方格可以直接进入该研究的数据页面。比如这里点击胃癌,可以进入TP53在胃癌中的表达数据页面。

Reporter代表探针。一般芯片对同一基因可能会设计多个探针(分别针对基因的不同位置的序列),不同的探针会返回不同的信号值,因此选择不同的探针,分析的结果就会不同,当然,不同的探针的结果不能放在一起进行比较(当成是同一探针)。检索时Oncomine会自动显示P值最小的结果。

页面最下方显示数据来源。如上图中所选择的分析来源是GEO数据库中的GSE13911研究。我们一般要使用这个研究的数据时,除了引用Oncomine之外,还要引用这个分析来源(原始文献)。

当然,我们也可以进行单基因的Meta分析。输入目的基因后,根据研究目的,选择相应数据集,比如我们这里依旧想看一下TP53与肠型胃癌的关系。勾选该数据库包含所有肠型胃癌的数据子集后,点击上方Compare按钮。

Meta分析结果显示TP53在肠型胃癌中的表达情况,P值<0.05。勾选的分析名称前面的数字对应Meta分析结果里的序号。Meta分析的的意义在于整合比较该基因在不同研究和不同分析中的表达情况,结果可以直接用于文章中。

4.  基因表达与临床相关性

说起基因表达,那必须要研究生存呀。这里我们想看TP53在胃癌中的生存情况,输入基因名称后,依次选择左侧栏的筛选条件,页面自动跳转。

由于我们是免费版本,所以这些数据不能下载,要手动摘录样品名称、基因表达、生存状态及生存时间数据后再利用其他软件(SPSS、GraphPad、R等)做生存分析。

数据少的话尚不费力,但碰到巨多样本的时候怎么办?一个个摘录就没意思啦。这里告诉大家一个小窍门,我们上文数次提到数据来源,这个很重要,我们可以根据数据来源来直接下载数据。如下图:根据Pubmed链接可直接链接至该文章,一般在补充材料部分作者会上传该项研究的基因表达及临床相关信息,包括临床病理参数及生存情况。这时候我们下载后便可以进行后续分析啦。当然,有的上传部分或者干脆没有上传的也无可厚非,大家可以先自行找一下。

如果有临床病理参数数据的话,自然也可以进行基因表达与临床病理参数的相关分析,比如肿瘤分期分级、突变、药物敏感性等。操作过程同上,输入目的基因后,选择癌症类型,选择病理亚型。

5.     基因共表达分析

输入目的基因TP53,依次选择左侧筛选框内的筛选条件后,页面跳转如下:

图中显示,与TP53表达相关系数最高为0.753,我们可以进一步检索这些高相关性基因的功能,必要时进行实验验证。

我们要注意的是Oncomine中的共表达不能对多个研究进行比较(Meta分析)。因为不同的研究中,与目标分子共表达的基因大多是不同的,所以在选择研究名称时,尽量选择“cell line”的研究,因为在细胞系中检测,相对于临床组织样本,个体差异更小,干扰更小,后期实验可预期性会更好。

好啦,今天给大家介绍了Oncomine的大部分功能,整体不难,傻瓜式的点点点,具体还有更多更为详尽的功能等着大家去发掘,而不仅限于查看一个基因是否差异表达哟!

(0)

相关推荐

  • 找到一个基因家族,基本上可以坐等发SCI

    研究背景: 角蛋白(KRTs)是上皮细胞的中间细丝形成蛋白,被广泛用作癌症的诊断生物标志物,并与多种癌症的肿瘤发生和转移有关.然而,KRTs在黑色素瘤中的多种表达模式和预后价值尚未阐明. 研究方法: ...

  • 牛呀,一个星期就写出了一篇SCI

    这样也能发6分SCI,这位研究生是在太厉害了 一次性付费学习所有课程 快速抢发3-5分纯生信SCI 看这些可以快速发几篇SCI? 单细胞数据挖掘课程重磅上线 又有学员向我们报喜,利用我们的课程成功发表 ...

  • 纯生信数据挖掘,就不能发高分文章?

    最近有人问我们,纯生信数据挖掘能不能发高分文章?答案是可以的.那怎么样发呢 GEO+Oncomine. 1 筛选差异基因 2 GO分析 3 Pathway分析 4 PPI分析 5 将最关键的差异基因进 ...

  • 平平无奇,8个数据库凑一篇5+纯生信?别犹豫了,赶紧上车!

    解螺旋公众号·陪伴你科研的第2562天 零代码复现基因家族分析 今天我为大家带来一篇发表在Frontiers in Oncology杂志上,影响因子为4.848的一篇分析基因家族的生信文章,之前我复现 ...

  • 这些图表是生信的入门分析,直接看着教程做,简单又好用!成就感soso的!

    解螺旋公众号·陪伴你科研的第2582天 经典的单基因生信研究套路 今天跟大家一起学习一下非常经典的单基因生信研究套路,且如果看到本篇推送的小伙伴是研究乳腺癌的话,那真是幸运的一天呦,为何如此说呢,让我 ...

  • 做生信数据挖掘一定要会编程吗

    自从meta分析贬值了之后,生信数据挖掘成为了国内医生.研究生.博士.教师火爆的发文神器,可是令人头痛的事情来了,生信往往需要学习编程,其中R就必不可少,如果要挖TCGA.SEER,Perl或者Pyt ...

  • 生信分析43.肝癌的免疫浸润,创新点挺多

    生信论文的套路 ONCOMINE从全景.亚型两个维度做表达差异分析: 临床标本从蛋白水平确认(或HPA数据库),很重要: Kaplan-Meier Plotter从临床意义的角度阐明其重要性: cBi ...

  • 干也好,湿也好,都好难离开这两个神器

    做肿瘤数据挖掘也好,还是基础科研也好,都难离开这两个神器.这两个神器是什么呢?一个就是Oncomine,另一个就是OncoLnc. Oncomine的主要用途; 分析基因在癌组织中的表达水平,一般都是 ...

  • SCI科研写作:仅利用数据库如何做好单基因免疫浸润生信分析

    怎样才能不做实验,不用R语言,还能发3分+SCI? 今天介绍几个可以用得上的数据库,只利用数据库中的数据进行分析,甚至不用R,利用在线分析工具,敲敲电脑就能解决急需发文章,没时间做实验,没有科研经费的 ...

  • 那么火的肿瘤免疫分析,这个在线数据库就能搞定!

    解螺旋公众号·陪伴你科研的第2508天 该数据库这么火,不是没道理! 肿瘤与免疫系统的相互作用在肿瘤的发生.发展和治疗中起着至关重要的作用. 细胞溶解性免疫细胞(T/NK细胞)最初的目的是识别和杀死癌 ...

  • 肿瘤蛋白相互作用分析数据库

    作图丫聚焦生信技能,前沿文章,个性绘图以及生信技能培训.有兴趣的小伙伴快来关注吧! ---------分割线---------- 对于相互作用分析的而言,我们之前介绍过STRING.BioGRID和C ...

  • [数据库介绍]MEXPRESS:TCGA甲基化分析数据库

    TCGA数据库是一个包括33种癌的各个组学的数据库.我们通过TCGA数据库可以观察每个人的基因表达的变化:甲基化的变化:拷贝数的变化:以及他们的临床信息.MEXPRESS(https://mexpre ...

  • 肿瘤细胞系综合性分析数据库

    在昨天的推送当中,我们介绍了现在的 CCLE 数据库的一些基本信息.同时也提到了一个用来分析 CCLE 的在线的数据库:DepMap Portal (https://depmap.org/portal ...

  • 肿瘤相关miRNA综合性分析数据库

    对于 miRNA 的数据库而言,之前我们介绍的 miRNA 的数据库主要还是集中在 miRNA 靶基因预测方面的. 1. [[miRactDB-肿瘤当中miRNA靶点预测数据库]] 2. [[miRN ...

  • 肿瘤微环境和免疫治疗课题思路介绍及热点方向分析专题会议 10月16-17日

    课程简介 肿瘤微环境和免疫治疗"相关研究不仅在国际学术论文发表上表现强劲,发表数量逐年递增.从近年的国家自然科学基金资助的项目数和总金额来看,肿瘤微环境和免疫治疗方向相关立项也是节节攀升,反 ...

  • m7G与疾病相关性分析数据库

    说起RNA甲基化,在调控基因表达.编辑.稳定性及降解等方面扮演重要角色,相比于 DNA 甲基化,RNA甲基化显得更加复杂,普遍存在于各种生物中.主要包括m1A.m5C.m6A及m7G等.其中m6A甲基 ...

  • 16S测序全新分析流程QIIME2的介绍

    16S rRNA测序是利用高通量测序技术,通过检查环境微生物(主要是细菌)16S特定可变区的丰度,以此鉴定生物标本细菌群落的分类及丰度的一项技术.16S rDNA指细菌基因组中编码核糖体16S rRN ...

  • 抗肿瘤中药分析,看中医药如何抗肿瘤

    肿瘤是严重威胁人类健康的一类疾病.临床治疗肿瘤,西医一般采用手术.放化疗.靶向治疗等,对早中期肿瘤有治疗效果,但存在一定的损伤和毒副作用. 中医药治疗肿瘤已有数千年历史,对于肿瘤病因病机之认识,渐趋一 ...