如何进行多样本秩和检验?
非参数秩和检验是参数检验重要的补充。秩和检验是非参数检验的重要方法。多组定量数据的比较,主要的方法有两种。一种是F检验,一种是已经介绍过的属于非参数检验的秩和检验。
之前介绍过成组两样本的秩和检验,一般来说两样本秩和检验是t检验的补充,多组样本如果检验如果是正态性不符合时,我们采用的多样本秩和检验,即Kruskal Wallis 检验。
实例分析
为研究霍乱菌疫苗不同给苗途径的免疫效果,随机将小鼠分为三组,分别施加不同的给苗途径,测定免疫21天后血清抗体滴度水平,问各组间的血清抗体滴度水平之间是否存在差异?数据库见didu.sav
思考
这个案例需要思考:
-这个案例由几个变量组成?
-研究的结局变量是什么?
-结局变量属于什么类型的变量?
-如果是定量变量数据,是偏态还是正态分布?
-研究目的是比较,那比较的组数是多少?
案情分析
这个案例包括2个变量,一个是血清抗体滴度(s),另外一个是分组变量(实验因素)。主要研究的结局指标是血清抗体滴度,为定量变量数据;比较的组数是3组(气雾80亿/ml、气雾100亿/ml、皮下注射)。本案例目的是比较多组总体有无统计学差异。
统计分析策略
多组定量数据的比较,基本的方法有2种。一种是成组F检验,一种是多样本的非参数秩和检验(Kruskal Wallis 秩和检验)。
究竟采用哪种方法,必须考虑“三个性”的条件:正态性、独立性、方差齐性。关于“三个性”的解释,可以看之前的文章,此处不再赘述。
Kruskal Wallis 秩和检验 和两样本秩和检验(Wilcoxon Mann Whitney检验)一样,都是非参数检验一种,它们对数据的分布没有要求,不要求正态性、方差齐性的应用条件,它们主要是探讨总体的分布位置有没有差异,而非总体均数。
总结来说,对于本例:
如何SPSS进行多样本秩和检验
本日软件操作的SPSS数据库是didu.sav,加入课程群即可获得。
多样本秩和检验入口界面
秩和检验入口有两个,本处采用常用的入口:分析—非参数检验—旧对话框-K个独立
多样本秩和对话框
多样本秩和与多样本方差分析的操作界面有点类似。
① 检验类型:克鲁斯卡尔-沃利斯H 检验即Kruskal Wallis 方法
② 精确&选项:“精确“按钮中可以选择确切概率的方法进行分析。一般可以不选择,默认为正态法;“选项按钮”可统计描述,但意义不大。
③ 定义范围:这一按钮在两样本t检验和两样本秩和检验都出现过,但此处是要填写该分组变量在数据库赋值中的最大值和最小值。
统计分析结果与解释
多样本秩和检验结果有两张表。第一张表为不同组数据平均秩次的描述,过程性结果,意义不大。
第二表为多样本秩和检验结果,如下表:检验统计量H值(近似于卡方检验的卡方值)12.267,P=0.002。
偏态资料的多重比较方法
多样本秩和检验的结果,当P≤0.05,可以进行多重比较。秩和检验多重比较,也存在多重方法,比如α分割的方法,SPSS带的Bonferroni方法,还有Nemenyi方法、DSCF方法等。但后面两种方法SPSS软件均无法实现。
α分割即多重比较时采用两两比较的Wilcoxon 两样本秩和检验,但是检验水准α不再是0.05,而是等于0.05/比较次数。
本文主要对SPSS自带的Bonferroni方法进行介绍。具体入口界面如下:分析—非参数检验—独立样本(本入口实际上是多样本秩和检验的第二个入口,只不过操作略显复杂,因此,只在多重比较时使用。)
然后,“字段”界面,选择纳入"抗体滴度"到"检验字段",选择分组变量到“组”。
接着,“设置”界面,选择定制检验,在定制检验中,选择“克鲁斯卡尔-沃利斯单因素分析”,多重比较中选择“全部成对”。
点击“运行”,得到以下结果:本结果即多样本秩和检验的分析结果,显示P值。
然后,双击该结果,得到以下的结果。该结果显示多样本秩和检验的检验统计量,P值(①),点击右下方选项框,选择成对比较即可(②)。
最终显示,多重比较的结果:分别进行三次多重比较,显示各次比较的统计量,标准误、P值和Bonfferroni校正P值(Adj.Sig. 以校正P值为准)
提醒:上表有两个P值:sig和Adj.Sig,sig是a分割的结果,P≤0.05/3=0.017才有统计学意义;而Adj.Sig是统计软件自动校正的结果,Adj.Sig是≤0.05就有统计学意义。
结果及表格的规范表达
规范的统计表(其中一种形式)为:
提醒:中位数(P25,P75)算法见day2-2推文;多组比较无法计算差值及95%CI置信区间
多样本秩和检验的注意事项
3.非参数检验的特点
现在总结一下多样本秩和检验的特性
-稳定性,对数据的改变不敏感
-广泛适用性
-可用于等级资料分析
-难以充分利用资料信息
-正态分布时,检验效能不如参数检验
4. 什么时候用多样本秩和检验
以下本人在多组数据比较时的分析习惯,仅供参考:
至少一组数据严重偏态分布,必须选择Kruskal Wallis秩和检验
如果数据理论上属于偏态分布,无论正态性检验P值,优先考虑Kruskal Wallis秩和检验(理论上意思是大规模真实人群的情况,一般是一种常识)
无论正态性检验P值大小,如果研究变量分布直方图呈一边倒趋势,或者存在若干个极端异常值,优先考虑Kruskal Wallis秩和检验
若至少一组数据正态性检验P值接近0.01或者<0.01,优先考虑Kruskal Wallis秩和检验
-本讲结束-