交叉设计(Cross-over Design)是一种特殊的自身配对设计,具体操作是按照事先设计的试验次序,将研究对象先后实施各种处理。比如两种处理(A、B)、两阶段(Ⅰ、Ⅱ)的交叉设计,就是将条件近似的试验对象随机分为两组,分别接受A和B的处理,这是试验的第Ⅰ阶段;其后进入第Ⅱ阶段,在第Ⅰ阶段接受A处理的研究对象在第Ⅱ阶段接受B处理,而在第Ⅰ阶段接受B处理的研究对象在第Ⅱ阶段接受A处理,由于两种处理(A、B)在全部试验过程中是交叉进行的,所以这种设计被称为交叉设计。该设计有一个非常重要的限制条件,要求前一个阶段的处理效应不能持续到下一个试验阶段,为此两个试验阶段之间需要有一个洗脱期(wash out time),以消除残留效应(carry-over effect)的影响。在研究药物时,洗脱期间不服用其他药物,洗脱期的长短需要根据药物半衰期来定。交叉设计一般用于需要较长时间或需要长期治疗的一些疾病的治疗研究。
交叉设计资料可以采用方差分析来进行统计分析,能分析处理(药物)效应、阶段效应和个体差异,在进行分析时软件是通过多因素的方差分析模块来实现的。需要注意的是由这个三个因素构建的单元格中,每个格子只有一个观测值,即单元格内无重复值,因此不能研究各因素间的交互作用,方差齐性也无法采用常规的方法来进行。如果实在想考察方差齐性,可以考虑采用线性回归的方差齐性考察办法,毕竟方差分析也属于线性回归模型的范畴。本次笔记采用统计软件jamovi 2。jamovi是一款免费、开源的统计软件,甚至可以在线使用,提供了最常用的一些统计学功能,而且可以通过添加模块来实现更多的统计学功能。jamovi是基于R语言开发的图形用户界面,其所有的统计功能都可以通过R的jmv程序包来实现(jmp程序包:https://cran.r-project.org/web/packages/jmv/)。jamovi界面很友好,菜单简单明了,除了菜单式操作也有R语言的操作窗口,结果能够直接生成像三线表那样的表格,更为人津津乐道的是它有像JMP那样的动态交互,随着你对数据或者菜单选项的修改,结果也会随之变化。下载地址:https://www.jamovi.org/。示例:为研究高血压患者用A、B两种方案疗效的差别,对12名入组的患者进行了研究,随机让其中6名先以A法治疗,后以B法治疗;另外6名先用B法后用A法,记录治疗后血压的下降值(kPa),试分析A、B两种方案的疗效有无差别。
数据来源:SPSS统计分析高级教程/张文彤,董伟主编.-2版-北京:高等教育出版社,2013.3.
导入数据:点击软件菜单栏中最左边的按钮>>Import,找到需要导入的文件,单击文件即可。Jamovi可以导入常见的数据类型,包括excel、sas、spss、stata等。
我们可以通过变量(Variable)菜单对变量进行描述,也可以通过数据(Data菜单)对数据进行修改或调整。在数据窗口下,双击变量的名称可以实现对各个变量更为详尽的编辑:
方差分析:Analyses>>ANOVA,选择ANOVA:将bp选入dependent variable,patient、stage和treat选入Fixed Factor。其实patient作为随机变量纳入更为合适,但在jamovi的操作界面中未出现随机变量的选择框,本例的patient为自身配对,单元格中并没有重复数据,将其作为固定因素来分析,相应结果是一致的[张文彤SPSS高级分析教程]。
这时候结果窗口不能显示结果,并报错:Residual sum of squares and/or degrees of freedom is zero, indicating a perfect fit。这主要是因为交叉设计资料的方差分析不能分析交互作用,需要在【模型】中对去掉各变量间的交互作用,如图:
选中Overall model test和η2,同时在【模型】选项中去掉交互作用,结果如下:
结果显示建立的模型是有统计学意义的(F=4.15,P=0.015),也就是说模型中至少有一个变量具有统计学意义。尚不能认为两种治疗方案(treat)的疗效有差异(F=4.60,P=0.058>0.05)。另外12名高血压患者间具有统计学差异,A、B两方案先后实行的阶段效应并无统计学差异,但这些并不是我们关注的重点。
η是用于分析名义变量和连续变量间相关性的指标,η2表示各因素所能解释的因变量的方差比例,比如η2treat=1.707/(17.908+0.427+1.707+3.711)=0.072。注意结果生成的表格直接是三线表,还是挺工整的,在表格中点击右键也可以进行复制和导出等操作。
在【模型假设考察】中选中Homogeneity test、Normality test和Q-Q Plot,结果中会同步显示考察结果:
如前所言,交叉设计资料的方差分析不能直接考察方差齐性。其实正态分布的考察也是对单元格数据的考察,也不能直接进行检验,结果中的正态性检验也是对模型残差的正态性检验,提供了三种方法的检验结果,三种方法结果均无统计学意义,即模型满足正态分布,Q-Q图中数据点基本上在对角线附近,满足正态分布的要求。本例只有两个组,不涉及【比对检验】和【两两比较】。【边际均值估计】:这里需要说明均值和边际均值的差别,均值就是原始样本的均值,其比较用的是事后两两比较;但边际均值是基于当前模型,在固定了其他因素的作用后根据样本计算出的均值估计值。对于单因素模型、包含全部交互作用的全模型而言,边际均值就等于各样本各单元格的均值,但对不平衡的设计或者含有协变量的模型,原始均值已经不能正确代表各种组合下因变量的平均水平,应考虑使用边际均值进行比较。本例两组样本例数相同,组均值等于边际均值,感兴趣的可以通过Analyses>>Exploration>>Descriptives进行均值的求解。
【保存】中只有一个[残差]一个选项,选中后表格中自动生成模型的残差。我们可对模型的残差进行正态性和方差齐性的检验。具体方法可参见以前的文章《线性回归中的正态分布》以及《线性回归中的方差齐性探察》。