30天学会医学统计与SPSS公益课程(Day 7):多样本秩和检验

隶属第二章:实验性研究定量数据的统计分析策略

非参数秩和检验是参数检验重要的补充。秩和检验是非参数检验的重要方法。多组定量数据的比较,主要的方法有两种。一种是F检验,一种是已经介绍过的属于非参数检验的秩和检验。

之前介绍过成组两样本的秩和检验,一般来说两样本秩和检验是t检验的补充,多组样本如果检验如果是正态性不符合时,我们采用的多样本秩和检验,即Kruskal Wallis 检验。

实例分析

为研究霍乱菌疫苗不同给苗途径的免疫效果,随机将小鼠分为三组,分别施加不同的给苗途径,测定免疫21天后血清抗体滴度水平,问各组间的血清抗体滴度水平之间是否存在差异?数据库见didu.sav


1



思考

这个案例需要思考:

-这个案例由几个变量组成?

-研究的结局变量是什么?

-结局变量属于什么类型的变量?

-如果是定量变量数据,是偏态还是正态分布?

-研究目的是比较,那比较的组数是多少?


2



案情分析

这个案例包括2个变量,一个是血清抗体滴度(s),另外一个是分组变量(实验因素)。主要研究的结局指标是血清抗体滴度,为定量变量数据;比较的组数是3组(气雾80亿/ml、气雾100亿/ml、皮下注射)。本案例目的是比较多组总体有无统计学差异。


3



统计分析策略

多组定量数据的比较,基本的方法有3种。一种是成组F检验,一种是多样本的非参数秩和检验(Kruskal Wallis 秩和检验)。

究竟采用哪种方法,必须考虑“三个性”的条件:正态性、独立性、方差齐性。关于“三个性”的解释,可以看之前的文章,此处不再赘述。

Kruskal Wallis 秩和检验 和两样本秩和检验(Wilcoxon Mann Whitney检验)一样,都是非参数检验一种,它们对数据的分布没有要求,不要求正态性、方差齐性的应用条件,它们主要是探讨总体的分布位置有没有差异,而非总体均数。

总结来说,对于本例:

Kruskal Wallis多样本秩和检验仍然要求独立性条件符合。本例采用随机化分组设计,独立性要求达到。
正态性方面,采用的是多样本正态性检验方法,探讨各组是否均来自于正态分布总体。经SW检验(夏皮洛-威尔克检验),三组数据的正态性检验均P<0.001,三组数据正态性均不符合,可考虑多样本秩和检验。

如何SPSS进行多样本秩和检验

1

多样本秩和检验入口界面

秩和检验入口有两个,本处采用常用的入口:分析—非参数检验—旧对话框-K个独立

2

多样本秩和对话框

多样本秩和与多样本方差分析的操作界面有点类似。

① 检验类型:克鲁斯卡尔-沃利斯H 检验即Kruskal Wallis 方法

② 精确&选项:“精确“按钮中可以选择确切概率的方法进行分析。一般可以不选择,默认为正态法;“选项按钮”可统计描述,但意义不大。

③ 定义范围:这一按钮在两样本t检验和两样本秩和检验都出现过,但此处是要填写该分组变量在数据库赋值中的最大值和最小值。

3

统计分析结果与解释

多样本秩和检验结果有两张表。第一张表为不同组数据平均秩次的描述,过程性结果,意义不大。

第二表为多样本秩和检验结果,如下表:检验统计量H值(近似于卡方检验的卡方值)12.67,P=0.002。

4

偏态资料的多重比较方法

多样本秩和检验的结果,当P<0.05,可以进行多重比较。秩和检验多重比较,也存在多重方法,比如α分割的方法,SPSS带的Bonferroni方法,还有Nemenyi方法、DSCF方法等。但后面两种方法SPSS软件均无法实现。

α分割即多重比较时采用两两比较的Wilcoxon 两样本秩和检验,但是检验水准α不再是0.05,而是等于0.05/比较次数。

本文主要对SPSS自带的Bonferroni方法进行介绍。具体入口界面如下:分析—非参数检验—独立样本(本入口实际上是多样本秩和检验的第二个入口,只不过操作略显复杂,因此,只在多重比较时使用。)

然后,“字段”界面,选择纳入'抗体滴度'到'检验字段',选择分组变量到“组”。

接着,“设置”界面,选择定制检验,在定制检验中,选择“克鲁斯卡尔-沃利斯单因素分析”,多重比较中选择“全部成对”。

点击“运行”,得到以下结果:本结果即多样本秩和检验的分析结果,显示P值。

然后,双击该结果,得到以下的结果。该结果显示多样本秩和检验的检验统计量,P值(①),点击右下方选项框,选择成对比较即可(②)。

最终显示,多重比较的结果:分别进行三次多重比较,显示各次比较的统计量,标准误、P值和Bonfferroni校正P值(Adj.Sig. 以校正P值为准

结果及表格的规范表达

根据上表,我们可以得到以下的规范的结论:
规范文字:80亿气雾组抗体滴度为1:20(20, 40),100亿气雾组抗体滴度为1:40(20,80) ,皮下注射组抗体滴度为1:40(40, 80) ,三组抗体总体分布存在着统计差异(H=12.67,P=0.002)。其中,80亿气雾组抗体滴度与皮下注射组存在着统计差异(adj. P=0.002),80亿气雾组抗体滴度与100亿气雾组、100亿气雾组抗体滴度与皮下注射组差异没有统计学意义(adj. P>0.05)

规范的统计表(其中一种形式)为:

多样本秩和检验的注意事项

1.多样本秩和检验检验结论取决于研究设计
秩和检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,秩和检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。
但是秩和检验如果用在观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。
上述这段话实际上是之前系列课程的重复,但必须再三强调:无论t、F还是秩和检验,在随机对照研究中结论可靠,但是在观察性研究中,只能说组间存在着差异,不能说明分组变量和结局变量的因果关系。
2. 两样本比较,也可以用多样本秩和检验
两样本秩和检验(Wilcoxon Manny Whitney方法)可以探讨两组偏态数据总体分布位置有无统计学差异。同时,两组偏态数据总体分布位置也可以采用多样本秩和检验,而且两样本时,两样本秩和检验和多样本Kruskal Wallis检验的结果是一致的。所以别奇怪很多场合下,两组数据比较,采用了Kruskal Wallis方法。

3.非参数检验的特点

现在总结一下多样本秩和检验的特性

-稳定性,对数据的改变不敏感

-广泛适用性

-可用于等级资料分析

-难以充分利用资料信息

-正态分布时,检验效能不如参数检验

4. 什么时候用多样本秩和检验

作为多样本F检验重要的补充,多样本Kruskal Wallis秩和检验用途广泛。一般来说,多组数据比较,用F检验还是秩和检验没有明显的界限,特别是近似正态分布的数据(正态性检验P<0.05),秩和检验和F检验很难说必须选择哪一种方法。虽然任何一组正态性检验P<0.05,均可以放弃F检验而选择秩和检验,但我一般多组近似正态分布者,选择的是F检验,只有存在着严重偏态分布者采用秩和检验检验。

以下本人在多组数据比较时的分析习惯,仅供参考:

  • 至少一组数据严重偏态分布,必须选择Kruskal Wallis秩和检验

  • 如果数据理论上属于偏态分布,无论正态性检验P值,优先考虑Kruskal Wallis秩和检验(理论上意思是大规模真实人群的情况,一般是一种常识)

  • 无论正态性检验P值大小,如果研究变量分布直方图呈一边倒趋势,或者存在若干个极端异常值,优先考虑Kruskal Wallis秩和检验

  • 若至少一组数据正态性检验P值接近0.01或者<0.01,优先考虑Kruskal Wallis秩和检验

-本讲结束-

(0)

相关推荐