SPSS教程:分层卡方检验(CMH检验)

提到卡方检验,相信很多小伙伴一定会觉得这还不简单,不就是率的比较嘛,只要是看到分类变量,就直接用卡方检验,拿SPSS两三下算出结果,得出P<0.05,然后心里还美美的,顺便玩一把王者农药犒劳一下自己。

不过,当你努力打着排位赛,试着提升自己段位时,倒不如花一点时间,跟着小咖一起学习一点有趣的统计知识,让自己在统计学的大坑里,也能够不断掌握经验,提升等级,相信也会是一个还不错的选择。

分层分析是一种常用的控制混杂因素的方法,它将数据资料根据混杂因素进行分层,然后计算各层内的OR值:如果层间OR值不一致,则说明分层因素可能存在混杂作用,需要分开报告OR值;如果层间OR值同质,则可以将OR值进行合并,从而计算调整后的OR值。

那么,如何判断层间OR值是否一致呢?是否有相关的统计学方法来进行检验呢?如果层间OR值同质,又该如何计算合并的OR值呢?这个时候,卡方检验家族就要派“分层卡方检验”上场了,本期内容就来向大家进行详细介绍。

分层卡方检验

分层卡方检验,也称为Cochran-Mantel-Haenszel检验(CMH检验),它主要用于上述的分层分析中,也就是在研究暴露/处理因素和结局事件关联性的基础上,考虑了分层因素的混杂作用。

CMH检验通过对分层因素进行控制,从而考察调整之后暴露/处理因素与结局事件之间的关联性。实际上CMH检验,已经不再是单纯的单因素分析,而是已经开始融入了多因素分析的思维模式,应该算作为一种最为简单的多因素分析方法。

研究实例

举一个例子吧,小咖同学拟探讨吸烟对某疾病发生风险的影响,共纳入了350名研究对象,并记录了他们的疾病状态、吸烟、性别等信息。

小咖首先对吸烟因素和疾病之间的关联性进行了卡方检验,其结果显示Pearson χ2=3.607,P=0.058,OR=1.701,95% CI为0.980-2.953,无统计学显著性,可认为吸烟对于该疾病的发生风险并无影响。

(想知道如何计算OR值?请查看:SPSS详细教程:OR值的计算

没有得出阳性结果的小咖很不开心,但小咖发现卡方检验的P值已经很接近0.05了,而且OR>1,倾向于认为吸烟是一个危险因素。于是小咖又重新对数据进行了一番审查,结果发现在男性和女性中,吸烟人群所占的比例存在着较大的差异,其中男性吸烟者为49.6%,女性吸烟者为18.4%,两组相比差异具有统计学显著性(P<0.001)。

小咖判断,性别可能为一个混杂因素,影响了初步分析时吸烟对该疾病的整体效应,因此小咖决定把性别作为一个分层因素,采用分层卡方检验,来分析不同性别分层下,吸烟因素对于该疾病发生风险的影响。

SPSS操作

点击Deive Statistics → Crosstabs

在Crosstabs对话框中,将Disease选入行变量Row(s)框中,将Smoke选入列变量Column(s)框中,将分层因素Gender选入Layer框中作为分层依据。

如果需要同时控制多个分层因素时,可以点击Next,将下一个分层因素选入框中,SPSS允许最多设置8层。

点击Statistics,勾选Chi-square、Risk和Cochran’s and Mantel-Haenszel statistics,点击Continue返回,点击OK完成操作。

结果解读

1. 在Chi-square Tests卡方检验的表中,分别给出了男性(Male)、女性(Female)和总体人群卡方检验的结果。

对于男性,Pearson χ2=8.433,P=0.004,OR=2.769,95% CI为1.368 - 5.607,有统计学显著性,提示在男性中,吸烟是该疾病的一个危险因素。

对于女性,Pearson χ2=0.966,P=0.326,OR=0.463,95% CI为0.097-2.214,无统计学显著性,提示在女性中,吸烟对该疾病的发生没有影响。

2. Test of Homogeneity of Odds Ratio,即对不同分层下OR值是否一致进行检验,也称为OR值同质性检验。表格中输出了两种同质性检验方法的统计量及其检验结果,Breslow-Day方法 χ2=4.624,P=0.032,Tarone's 方法 χ2=4.617,P=0.032。两种方法都显示P<0.05,提示按照性别分层后,层间的OR值存在着一定的异质性。

3. Tests of Conditional Independence,即分层卡方检验的结果,其行变量和列变量分别为疾病和暴露因素,其假设检验为“病例组和对照组的暴露因素的比例是否有差异”。

表格中输出了两种方法的统计量,Cochran’s 方法 χ2=4.599,P=0.032,Mantel-Haenszel 方法 χ2=3.960,P=0.047,前者是后者的改进,两种方法都显示 P<0.05,提示在考虑了性别的分层因素影响后,吸烟因素与该疾病的发生风险有关。注意,此时卡方值的大小只能推断有无关联,但并不能表示关联的程度。

4. Mantel-Haenszel Common Odds Ratio Estimate,即估计的合并OR值,是在上述Test of Homogeneity of Odds Ratio结果认为各层OR值同质的前提下,进一步去估算其合并的关联强度,SPSS使用Woolf法去检验OR值有无统计学显著性,其假设检验应该为“OR值是否等于1”。

本例结果显示,在控制了性别分层因素的影响后,吸烟因素对于该疾病的发生风险是一个危险因素,其合并OR=1.935,95% CI为1.065-3.519,Woolf法计算的P值为0.030。

但是,需要注意的是,在本例中,Test of Homogeneity of Odds Ratio的结果显示层间OR值存在一定异质性,因此此时不宜合并OR值,建议分层报告;若层间OR值一致,则可以报告最后合并的OR值。

撰写结论

1. 若层间OR值不同质,则分层报告结果,结果描述如下:

Test of Homogeneity of Odds Ratio结果显示P<0.05,提示层间的OR值具有异质性,此时不宜合并OR值。因此在按照性别进行分层后,在男性中,吸烟是该疾病发生的一个危险因素,OR=2.769,95% CI为1.368-5.607,P=0.004,即吸烟者该疾病的发生风险为非吸烟者的2.769倍;而在女性中,吸烟对该疾病的发生没有影响,OR=0.463,95% CI为0.097-2.214,P=0.326。

2. 若层间OR值同质,则结果描述如下:(本例研究不适用于此种情况,此处仅为举例说明)

Test of Homogeneity of Odds Ratio结果提示层间的OR值具有同质性(P>0.05),因此在控制了性别分层因素的影响后,吸烟因素对于该疾病的发生是一个危险因素,其合并OR=1.935,95% CI为1.065-3.519,P=0.047。

注意:对于前述“3. 分层卡方检验结果”和“4. 基于Mantel-Haenszel方法估算的OR值的检验结果”,两者的P值在结论上应该是保持一致的。

根据《医学统计学》(孙振球主编)教科书上的介绍,分层分析OR值可采用Mantel-Haenszel方法进行估计,并用Mantel-Haenszel卡方检验的χ2统计量直接对OR值进行假设检验,同时采用Miettinen法计算OR值的95%可信区间,因此此处可报告Mantel-Haenszel卡方检验的P值0.047。

而SPSS采用的是Woolf法计算OR值的95%可信区间,并对其进行检验,此时P=0.030。由于两者计算方法不同,因此P值的大小稍有差异,但其结论是一致的。

(0)

相关推荐

  • spss如何进行单样本的T检验?

    单样本T检验是SPSS数据处理软件中比较常用的功能,是用来检验数据是否存在统计学意义的一 种方法,是数据处理分析的前提条件,下面小编就来教大家如何进行单样本T检验吧! 打开一份SPSS的数据,格式为s ...

  • SPSS与R语言分层卡方检验案例教程集锦

    卡方检验-分层卡方 主要内容: 1)病因研究中的混杂因素 2)混杂因素的调整和校正 3)CMH统计检验概念 4)CMH统计检验步骤 5)SPSS案例操作 6)结果解读,做出统计推断 7)CMH统计检验 ...

  • SPSS如何对数据进行正态检验?

    正态检验是对数据的分布进行统计的一种方式,往往用于方差检验的前提条件,今 天小编就来教大家如何通过SPSS对数据进行正态检验吧! 我们对三组同学的成绩进行统计分析,检验他们的成绩是否符合正态分布. 我 ...

  • SPSS如何进行单样本T检验

    今天教大家如何使用SPSS进行单样本T检验吧,这个在统计数据上有很大帮助的. 首先打开SPSS软件,打开小编之前填写好的数据. 我们这测的是蛋白含量的单样本T检验,所谓单样本T检验是对一个样本与检验数 ...

  • SPSS教程:3个及以上观察者的一致性检验(Kendall''s W检验)

    一.问题与数据 某研究者拟分析5位放射科医生对疾病严重程度诊断的一致性.现搜集50位研究对象的MRI检查结果,要求放射科医生针对每份MRI检查给予Grade I(最轻)到Grade V(最重)五个等级 ...

  • SPSS教程—进行多独立样本之间两两比较的非参数检验

    一般来说在研究中,我们往往会有多个独立的样本需要进行比较分析,如果样本数据观察值不满足独立性或正态分布的条件,则我们需要使用到多个独立样本的非参数检验. 为了分析多个独立样本互相之间对结果的产生是否有 ...

  • SPSS教程:判断数据正态分布的超多方法!

    当我们应用统计方法对数据进行分析时,会发现许多计量资料的分析方法,例如常用的T检验.方差分析.相关分析以及线性回归等等,都要求数据服从正态分布或者近似正态分布,但这一前提条件往往被使用者所忽略.因此为 ...

  • 配对样本t检验,史上最完整SPSS操作教程!

    一.问题与数据 研究者想验证一种新型运动饮料配方是否有助于提高人们的跑步距离.传统饮料配方为纯碳水化合物,而新型饮料为碳水化合物-蛋白质混合物. 为了比较两种运动饮料对人们跑步距离的影响差异,研究者招 ...

  • SPSS独立样本T检验如何进行样本量计算?(送样本量估计软件及教程!)

    杏花开医学统计 医学统计教程,统计分析服务 两组均数差(独立样本T检验) 样本量计算视频教程 文末送样本量估计软件及教程 关键词:样本量计算 深受大家喜爱的"样本量计算"系列视频来 ...

  • Logistic 回归简明教程 | 30天学会医学统计与SPSS公益课(Day20)

    30天学会医学统计与SPSS 本课程是高校医学统计学教授的公益.免费公开课!如假包换!我将每天推送视频和文字教程,讲授基于医学数据的各种统计分析策略.如果你能跟得上节奏,我相信在一个月后,您将会掌握医 ...

  • 多组率比较的卡方检验 ​ | 30天学会医学统计与SPSS公益课(D11)

    30天学会医学统计与SPSS 本课程是高校医学统计学教授的公益.免费公开课!如假包换!我将每天推送视频和文字教程,讲授基于医学数据的各种统计分析策略.如果你能跟得上节奏,我相信在一个月后,您将会掌握医 ...