Kaplan-meier Plotter数据库

今天我们再介绍一款生存分析的经典数据库,Kaplan-meier Plotter数据库,其操作上的选择更为丰富,图片可以直接用于论文无需后期处理,可以与PrognoScan数据库进行相互补充,称得上预后分析数据库的老大哥了。目前,使用Kaplan-meier Plotter数据库发表的论文刊登在了Cell、Nature、Cancer Discovery等著名期刊上,值得大家进行学习和掌握。Kaplan-meier Plotter数据库的网址如下:http://kmplot.com/analysis/,大家在使用的时候不要忘记在文章中进行引用哟~

一、Kaplan-meier Plotter数据库基本介绍

Kaplan-meier Plotter数据库基于GEO、EGA以及TCGA等公共数据库的基因芯片和RNA-seq数据构建而成,评估了54, 675个基因在21种癌症中对于生存率的影响,包括乳腺癌(6234例)、卵巢癌(2190例)、肺癌(3452例)和胃癌(1440例)。Kaplan-meier Plotter数据库通过整合基因表达信息以及临床预后价值进行Meta分析以及生存相关分子标志物的研究、发现以及验证。

在分析某一特定基因的预后价值时,Kaplan-meier Plotter数据库以该基因表达量的不同分位数为标准将患者分为两组,通过Kaplan-meimer生存图对两个队列进行比较并计算出HR,95%CI以及logrank P值。目前数据库对于mRNA水平的研究证据最为充分,miRNA、DNA以及蛋白水平的研究也在飞速发展,这些分子在Kaplan-meier Plotter数据库中的操作流程类似,因此接下来的内容都将以mRNA为例进行操作演示。

KM-plotter可以评估基因表达与生存之间的相关性

二、Kaplan-meier Plotter数据库使用页面介绍

输入网址http://kmplot.com/analysis/,进入Kaplan-meimer Plotter数据库主页面。页面中央几个颜色的方块分别对应了mRNA,miRNA,protein以及DNA等四种分子的检索入口,其中mRNA分为gene chip数据以及RNA-seq数据。前者包括乳腺癌、卵巢癌、肺癌以及胃癌的数据;后者包括肝癌以及泛癌分析的数据。接下来以乳腺癌为例介绍数据库页面的各个板块。点击“Start KM Plotter for breast cancer”或者右上角检索框下拉选择“Breast cancer”。

页面刷新后,如下图所示:

“Affy id/Gene symbol”处输入基因的ID,Kaplan-meier plotter数据库识别70, 632个基因符号(包括HUGO基因命名委员会批准的官方基因符号、以前的符号和别名——所有这些都列在结果页面中)。由于不同的基因名称可能重叠,Kaplan-meier plotter数据库建议交叉检查所选基因的ID;

点击右侧“Use multiple genes”可以输入多个基因,同时对所有这些基因进行分析(默认设置),或者使用基因的平均表达值(勾选“Use mean expression of the selected probes”)。最多允许输入65个基因;

点击“Split patients by”旁的对话框选择将病人分组的cutoff值,包括中位数、分位数等选项;

点击“Survival”旁的对话框可以选择预后观测指标,包括RFS、OS、DMFS、PPS等;

点击“Plot options”可以更改图片导出设置,包括图片的大小、字体、图例位置等;

中部右侧绿色方框的数字显示实时样本数量;

点击“Restrict analysis to subtypes”中的对话框可以更改筛选不同的疾病亚型;

点击“Restrict analysis to selected cohorts”中的对话框可以更改筛选不同病人的治疗方案。

页面下拉到最后点击“Draw Kaplan-Meier plot”即可出图。

三、示例文献复现

接下来我们以一篇文献为例,实际说明如何使用Kaplan-meier Plotter数据库进行出图。示例文献题目为Transcriptional expressions of Chromobox 1/2/3/6/8 as independent indicators for survivals in hepatocellular carcinoma patients,于2018年11月发表于Aging,影响因子为4.831分。

结合题目以及文章摘要可以看出,这篇文章主要探讨的是CBX家族8个分子对于肝癌患者生存预后的影响,其中文章的Figure 6就来源于Kaplan-meier Plotter数据库,发现CBX1-4, 6, 8分子与肝癌患者的低OS相关,而CBX7分子与高OS相关,CBX5分子则与肝癌患者的OS无显著相关性。

接下来我们演示一下如何得到这个结论与图片。输入网址http://kmplot.com/analysis/,进入数据库主页面。点击“mRNA”下“RNA-seq”中的“Start KM Plotter for liver cancer”。

页面刷新后,点击“Use multiple genes”。

刷新出来的页面中,在“Paste list of genes”中输入CBX1-8分子(输入完毕后会自动显示在左侧Genes selected栏),点击上方“Use mean expression of selected genes”即可分析整个CBX家族分子对于肝癌患者的预后影响。点击最下方的“Start analysis using selected probes”。

输入的分子会以绿色方框的形式最终显示在网页最上方。“Split patients by”选择“Auto select best cutoff”(注意这里与文献中Method部分描述的有所区别,应该系文献描述错误),“Survival”选择“OS”,点击页面最下方的“Draw Kaplan-Meier plot”。

页面刷新后下拉即可看到K-M曲线图,对应文章中的Figure 6A。点击下方的“Download”选项可以下载矢量图或者数据进行后期加工处理组图。

返回基因输入页面,“USE MULTIPLE GENES”处选择“Use list of genes”,其他操作与上述相同,最后点击“Draw Kaplan-Meier plot”。

页面刷新后依次出现CBX1-8的K-M图,对应文章中的Figure 6B-I。

使用AI将上述图片组合在一起即可得到文章中Figure 6的一整个大图了。

好了,Kaplan-meier Plotter数据库就介绍到这里啦

(0)

相关推荐