SPSS教程:分层卡方检验(CMH检验)
提到卡方检验,相信很多小伙伴一定会觉得这还不简单,不就是率的比较嘛,只要是看到分类变量,就直接用卡方检验,拿SPSS两三下算出结果,得出P<0.05,然后心里还美美的,顺便玩一把王者农药犒劳一下自己。
不过,当你努力打着排位赛,试着提升自己段位时,倒不如花一点时间,跟着小咖一起学习一点有趣的统计知识,让自己在统计学的大坑里,也能够不断掌握经验,提升等级,相信也会是一个还不错的选择。
分层分析是一种常用的控制混杂因素的方法,它将数据资料根据混杂因素进行分层,然后计算各层内的OR值:如果层间OR值不一致,则说明分层因素可能存在混杂作用,需要分开报告OR值;如果层间OR值同质,则可以将OR值进行合并,从而计算调整后的OR值。
那么,如何判断层间OR值是否一致呢?是否有相关的统计学方法来进行检验呢?如果层间OR值同质,又该如何计算合并的OR值呢?这个时候,卡方检验家族就要派“分层卡方检验”上场了,本期内容就来向大家进行详细介绍。
分层卡方检验
分层卡方检验,也称为Cochran-Mantel-Haenszel检验(CMH检验),它主要用于上述的分层分析中,也就是在研究暴露/处理因素和结局事件关联性的基础上,考虑了分层因素的混杂作用。
CMH检验通过对分层因素进行控制,从而考察调整之后暴露/处理因素与结局事件之间的关联性。实际上CMH检验,已经不再是单纯的单因素分析,而是已经开始融入了多因素分析的思维模式,应该算作为一种最为简单的多因素分析方法。
研究实例
举一个例子吧,小咖同学拟探讨吸烟对某疾病发生风险的影响,共纳入了350名研究对象,并记录了他们的疾病状态、吸烟、性别等信息。
小咖首先对吸烟因素和疾病之间的关联性进行了卡方检验,其结果显示Pearson χ2=3.607,P=0.058,OR=1.701,95% CI为0.980-2.953,无统计学显著性,可认为吸烟对于该疾病的发生风险并无影响。
(想知道如何计算OR值?请查看:SPSS详细教程:OR值的计算)
没有得出阳性结果的小咖很不开心,但小咖发现卡方检验的P值已经很接近0.05了,而且OR>1,倾向于认为吸烟是一个危险因素。于是小咖又重新对数据进行了一番审查,结果发现在男性和女性中,吸烟人群所占的比例存在着较大的差异,其中男性吸烟者为49.6%,女性吸烟者为18.4%,两组相比差异具有统计学显著性(P<0.001)。
小咖判断,性别可能为一个混杂因素,影响了初步分析时吸烟对该疾病的整体效应,因此小咖决定把性别作为一个分层因素,采用分层卡方检验,来分析不同性别分层下,吸烟因素对于该疾病发生风险的影响。
SPSS操作
点击Deive Statistics → Crosstabs
在Crosstabs对话框中,将Disease选入行变量Row(s)框中,将Smoke选入列变量Column(s)框中,将分层因素Gender选入Layer框中作为分层依据。
如果需要同时控制多个分层因素时,可以点击Next,将下一个分层因素选入框中,SPSS允许最多设置8层。
点击Statistics,勾选Chi-square、Risk和Cochran’s and Mantel-Haenszel statistics,点击Continue返回,点击OK完成操作。
结果解读
1. 在Chi-square Tests卡方检验的表中,分别给出了男性(Male)、女性(Female)和总体人群卡方检验的结果。
对于男性,Pearson χ2=8.433,P=0.004,OR=2.769,95% CI为1.368 - 5.607,有统计学显著性,提示在男性中,吸烟是该疾病的一个危险因素。
对于女性,Pearson χ2=0.966,P=0.326,OR=0.463,95% CI为0.097-2.214,无统计学显著性,提示在女性中,吸烟对该疾病的发生没有影响。
2. Test of Homogeneity of Odds Ratio,即对不同分层下OR值是否一致进行检验,也称为OR值同质性检验。表格中输出了两种同质性检验方法的统计量及其检验结果,Breslow-Day方法 χ2=4.624,P=0.032,Tarone's 方法 χ2=4.617,P=0.032。两种方法都显示P<0.05,提示按照性别分层后,层间的OR值存在着一定的异质性。
3. Tests of Conditional Independence,即分层卡方检验的结果,其行变量和列变量分别为疾病和暴露因素,其假设检验为“病例组和对照组的暴露因素的比例是否有差异”。
表格中输出了两种方法的统计量,Cochran’s 方法 χ2=4.599,P=0.032,Mantel-Haenszel 方法 χ2=3.960,P=0.047,前者是后者的改进,两种方法都显示 P<0.05,提示在考虑了性别的分层因素影响后,吸烟因素与该疾病的发生风险有关。注意,此时卡方值的大小只能推断有无关联,但并不能表示关联的程度。
4. Mantel-Haenszel Common Odds Ratio Estimate,即估计的合并OR值,是在上述Test of Homogeneity of Odds Ratio结果认为各层OR值同质的前提下,进一步去估算其合并的关联强度,SPSS使用Woolf法去检验OR值有无统计学显著性,其假设检验应该为“OR值是否等于1”。
本例结果显示,在控制了性别分层因素的影响后,吸烟因素对于该疾病的发生风险是一个危险因素,其合并OR=1.935,95% CI为1.065-3.519,Woolf法计算的P值为0.030。
但是,需要注意的是,在本例中,Test of Homogeneity of Odds Ratio的结果显示层间OR值存在一定异质性,因此此时不宜合并OR值,建议分层报告;若层间OR值一致,则可以报告最后合并的OR值。
撰写结论
1. 若层间OR值不同质,则分层报告结果,结果描述如下:
Test of Homogeneity of Odds Ratio结果显示P<0.05,提示层间的OR值具有异质性,此时不宜合并OR值。因此在按照性别进行分层后,在男性中,吸烟是该疾病发生的一个危险因素,OR=2.769,95% CI为1.368-5.607,P=0.004,即吸烟者该疾病的发生风险为非吸烟者的2.769倍;而在女性中,吸烟对该疾病的发生没有影响,OR=0.463,95% CI为0.097-2.214,P=0.326。
2. 若层间OR值同质,则结果描述如下:(本例研究不适用于此种情况,此处仅为举例说明)
Test of Homogeneity of Odds Ratio结果提示层间的OR值具有同质性(P>0.05),因此在控制了性别分层因素的影响后,吸烟因素对于该疾病的发生是一个危险因素,其合并OR=1.935,95% CI为1.065-3.519,P=0.047。
注意:对于前述“3. 分层卡方检验结果”和“4. 基于Mantel-Haenszel方法估算的OR值的检验结果”,两者的P值在结论上应该是保持一致的。
根据《医学统计学》(孙振球主编)教科书上的介绍,分层分析OR值可采用Mantel-Haenszel方法进行估计,并用Mantel-Haenszel卡方检验的χ2统计量直接对OR值进行假设检验,同时采用Miettinen法计算OR值的95%可信区间,因此此处可报告Mantel-Haenszel卡方检验的P值0.047。
而SPSS采用的是Woolf法计算OR值的95%可信区间,并对其进行检验,此时P=0.030。由于两者计算方法不同,因此P值的大小稍有差异,但其结论是一致的。