无需转发!科研菌送你列线图代码

一、列线图介绍列线图也称为诺莫图,英文Nomogram,本质上是一种用于求解方程的图形计算装置。使用者可以忽略方程式中各变量的复杂关系,单根据已知的变量值去画线就可以快速解出剩下的那个未知变量的大小。如下图,已知STR中的任意两个再划线就可以解出另外一个,非常直观明了。

图1.典型的三变量方程列线图(来自维基百科)医学论文中常见的列线图,如下所示,变量由一些临床指标(如T、N、复发)或作者自己得到的评价指标(RISK_score)组成,通过计算得分来预测患者的生存率。有了这样一幅图,医生便可以根据相应患者的各临床指标来计算得分从而预测生存率来指导临床治疗。若文章中有了这样一幅图,那么本文的临床指导意义将有很大提升。上面提到列线图是用于求解方程的,那么我们首先要构建一个预测预后的模型才能画图。通常来说,我们会利用构建好的Cox回归模型(或Logistic模型等)来画列线图,根据模型中每个因素的回归系数,对各取值水平进行赋分(及第一行的Points),各因素得分相加计算总得分(Total Points)后画一条竖线我们就可以预测患者的生存率啦。

图2. 文章中常见的列线图那么今天小编就根据之前推文2020年就这还能发4+分,小编已经哭晕了中的文章给出的风险评分模型,以及TCGA-LUAD数据来展示一下如何画一幅列线图,并给大家讲解一下如何解读,顺带也把预后类文章中常见的森林图也画了。在开始之前我们简要回顾一下这篇文章,作者主要利用TCGA-LUAD队列的数据,根据Estimate包分析得到的免疫评分将肿瘤样本分成高低免疫评分组,通过差异表达分析选取DEGs用于构建LASSO-COX模型,从而筛选变量得到一个9基因的风险评分模型。在评估了其预测能力后,联合其它临床特征进行单、多因素COX回归分析,最后构建了用于预测LUAD患者生存率的列线图。

流程图-来自小编麻辣烫二、列线图作图实例首先第一步是下载数据,前往UCSC-XENA数据库下载下图的三个文件,地址如下:https://xenabrowser.net/datapages/chort=GDC%20TCGA%20Lung%20Adenocarcinoma%20(LUAD)&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443

图3.下载数据第二步是要知道作者给出的模型,可以看到这是一个经LASSO-Cox分析的9基因预测模型。由于文中没有明说,小编下面就根据作者给出的RiskScore模型,直接用count值带入计算样本的风险得分。

图4.作者给出的模型第三步就是用R去进行分析啦。包括以下几个部分:加载需要用到的包,对基因表达数据进行预处理根据模型计算RiskScore画个生存曲线检验一下作者给出的RiskScore模型构建Cox回归分析所用的数据框对包括RiskScore在内的多个临床特征进行多元Cox回归绘制森林图观察各因素对结局的影响,小编先是用了ggforest的方法,之后又自己用ggplot2去画了画,一起分享给大家利用RMS包绘制列线图RMS包中绘制3年生存率的矫正曲线

图5.R中代码实操三、列线图解读上面我们根据9基因模型得到的风险评分以及患者的T、N分期为LUAD患者制作了预测生存率的列线图,并通过内部验证说明了其预测能力的可靠性,那么我们在实践中又要怎样使用呢?比如我们遇到如下一位LUAD患者,经询问以及计算得知如下信息T_stageN_stageRISK_scoreT3N0High_risk向右可滑动接下来我们根据对应的信息画竖线得到单项得分,T_stage得分大致为82分,N_stage得分为0,RISK_score得分大致为44。我们得到总分为82+0+44=126

图6.计算单项得分根据计算得到的总得分向下划线,我们就可以预测这位患者的3、5、10年生存率了!可以看到,该患者三年生存率约为53%,5年生存率约为20%,10年生存率连10%都不到了。

图7.根据总得分计算生存率小结以上预测模型纳入的变量是有点少的,因为这里只是给大家做个展示。如果想要让模型更加准确,列线图的临床意义更大,实用性更好,那么在原有代码的基础上,添加新的变量去分析就可以啦!今天的分享到这就告一段落啦,有疑问或指正欢迎大家在讨论区发言。

(0)

相关推荐