SPSS操作:多项测量指标的ROC曲线分析

在前面几讲中,我们已向大家介绍过如何依据一项测量指标设计和评价诊断试验。但在实际临床工作中,我们往往是根据多项指标综合判断病情的。比如,在诊断高血压时,我们会根据年龄、性别、并发症等多个因素同时评价受试者的患病情况。那么在这种情况下,我们应如何判断诊断结果的真实性呢?

一、问题与数据

某呼吸内科医生拟通过性别、年龄、BMI、COPD病史和是否吸烟等因素预测受试者的肺癌患病情况。他招募了85名肺癌患者,259名非肺癌患者,并通过查阅病历、问卷调查的方式收集了上述信息。变量的赋值和部分原始数据见表1和表2。如果该医生依据这几项因素预测受试者是否患肺癌,那么应如何预测,准确性又如何呢?

表1 肺癌危险因素分析研究的变量与赋值

表2 部分原始数据

从本质上讲,该研究也是结局变量为二分类的诊断试验。但是该诊断试验的测量指标很多,应该如何预测每一位受试者是否患肺癌呢?

我们可以通过二分类Logistic回归模型,用性别、年龄、BMI、COPD病史和是否吸烟等因素,计算受试者患肺癌的预测概率。

二、SPSS分析方法

1. 数据录入SPSS

2. Logistic回归分析

选择Analyze→Regression→Binary Logistic

(1)主对话框设置

将因变量cancer送入Dependent框中,将纳入模型的自变量sex, age, BMI和COPD变量Covariates中,选择Forward: LR的自变量筛选方法(Method对话框)。

(2)Categorical设置

本研究中,COPD是多分类变量,我们指定“无COPD病史”的研究对象为参照组,分别比较“轻/中度”和“重度”组相对于参照组患肺癌的风险。

点击Categorical→将左侧Covariates中的COPD变量送入右侧Categorical Covariates中。在Reference Category的右侧选择First(表示选择变量COPD中,赋值最小的,即“0”作为参照。)→点击Change→点击Continue。

(3)Save设置

点击Save→选择Probabilities→点击Continue。

三、Logistic回归结果

1. 纳入Logistic回归模型的变量

最终模型纳入了性别(sex)、COPD病史(COPD)和吸烟(smoke)三个变量。也就是说,这该Logistic回归模型认为,这三个变量可以预测是否患肺癌,而年龄和BMI并没有预测意义。

2. 个体患肺癌的概率

根据上述Logistic回归的结果,我们可以写出每个受试者根据性别、COPD病史和是否吸烟三个因素,预测是否患肺癌的危险得分Logit(P):

Logit(P)= -3.062 + 0.836*sex(男=1;女=0) + 0.454*COPD(轻度) + 1.281COPD(中/重度) + 1.237*smoke(无=0;曾吸/现吸=1)

并可以按照以下公式计算得到每一个受试者患肺癌的预测概率:

实际上,当点选了上述2.5的操作,运行该回归分析后,SPSS会自动生成每一位受试者的预测概率(PRE_1),而不需要上述的手工计算。

至此,我们就可以根据受试者的真实患病情况和预测概率,评估根据性别、COPD病史和是否吸烟三个因素,预测个体是否患肺癌的准确性了。

四、ROC曲线的绘制

1. 选择Analyze→ROC Curve

2. 主对话框设置

将已知的疾病情况cancer送入State Variable框中,预测概率Predicted probability送入Test Variable中,并在Value of State Variable框中填1→OK。

五、结果解读

SPSS的ROC曲线结果会给出ROC曲线和曲线下面积。

根据结果,我们可以知道该诊断试验的ROC曲线下面积是0.718,判断其准确性,并用于与其他诊断试验的比较。至于评价诊断试验的其它指标,需要我们根据预测概率(PRE_1)确定诊断截点(cut-off值)后再计算,有兴趣的小伙伴可以自己尝试计算哦。

(0)

相关推荐

  • 零基础学习SPSS软件

    作者:郑铿城,经济学博士,数学建模指导教练 开头,和大家讲个笑话 spss软件在数据处理分析中有较广的运用,适合各类学习群体,就算学习者不会编程,也可以通过spss软件实现数据的处理和模型的建立.以下 ...

  • JASP统计软件做logistic回归分析使用小结

    上一篇专门去练习使用JASP去完成一个logistic回归,与SPSS相对比,JASP在logistic回归方面还有一些不同之处,做个小结. 01 分类变量哑变量处理 JASP 0.13.1对分类变量 ...

  • 我们做的回归分析,到底是多元回归还是多变量回归?

    回归分析,包括线性回归.logistic回归等,当自变量多个的时候,叫多元回归还是多因素回归或者多变量回归? 我想很多发表的文章,甚至写的一些教科书,当自变量多个的时候,这个回归会被称为多元回归! 甚 ...

  • spss26最新版

    Spss26全称为Ibm Spss Statistics 26,它是来自国外的一款专业的数据统计分析软件.平时在我们的工作生活中,你是不是经常会被各种复杂.庞的数据给弄的焦头烂额呢,有了这款软件就再也 ...

  • 技术贴 | 利用graphpad绘制多指标的ROC曲线

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 ROC曲线(receiver operating characteristic curve,简称ROC曲线),以真阳 ...

  • 如何用SPSS做ROC曲线分析?看这1篇就够了!

    一.ROC曲线的概念 受试者工作特征曲线(receiver operator characteristic curve, ROC曲线),最初用于评价雷达性能,又称为接收者操作特性曲线.ROC曲线是以真 ...

  • 所有的散户们注意了,炒股连KDJ指标的运...

    所有的散户们注意了,炒股连KDJ指标的运用都不懂,那就远离股市吧!一文讲透KDJ的精髓,仔细看完,值得收藏! KDJ是股民做中短期趋势最常用的指标,又叫随机指标,但却很少能掌握其中的精髓,读懂就能轻松 ...

  • 5分钟视频教学 - 震荡指标的3个妙用

    振荡指标(英语:Oscillator,简称OSC),是动量指标的另一种表现方式,以振荡量的百分比来表示.资深交易员非常喜欢使用振荡指标结合其他指标/技术来确认自己的出入场时机. 在本期视频中,我们将一 ...

  • 使用综合评分法的采购项目,提供相同品牌产品且通过资格审查、符合性审查的不同投标人参加同一合同项下投标的,按一家投标人计算

    根据<政府采购货物和服务招标投标管理办法>(财政部令第87号)第三十一条:使用综合评分法的采购项目,提供相同品牌产品且通过资格审查.符合性审查的不同投标人参加同一合同项下投标的,按一家投标 ...

  • 帮你精通Linux:Find命令高阶操作4项动作

    前文中,我们详细阐述了Linux中最复杂的Find命令的基础查询之八列属性: 帮你精通Linux:Find命令的八大属性 八列属性 本文将继续探讨其高级查询功能,将分为四个方面展开讨论: 预定义动作 ...

  • [求助]关于“DUALVOL多空量比”指标的“红柱与绿柱”问题

    DUALVOLUME('M'):返回值代表一段时间内的(主动买-主动卖)的平均数值. DUALVOLUME('N'):返回值代表主动买-主动卖的量差. DRAWCOLUMNCHART(X,C1,C2) ...

  • Cox回归分析:详细的SPSS操作步骤

    Cox回归分析:详细的SPSS操作步骤 医咖会 09-06 12:07 大 问题与数据 某研究者拟观察某新药的抗肿瘤效果,将70名肺癌患者随机分为两组,分别采用该新药和常规药物进行治疗,观察两组肺癌患 ...

  • 信息熵的4个量化指标的R代码实现

    熵(entropy)在统计学中是一个很重要的概念,代表着信息的多少.经济学里面衡量贫富差距的基尼系数,以及环境生物学领域衡量物种多样性的辛普森多样性指数,以及免疫组库领域的D50都有异曲同工之妙. 基 ...