Day 9: 小统计大文章(下)
隶属第二章:实验性研究定量数据的统计分析策略
“小统计大文章”上篇介绍基础但经典的实验性研究研究设计和统计分析策略。在该例子中,比较试验组和对照组的效果来证明干预措施的价值。本篇继续“小统计大文章”,作为下篇,本文将情况稍微复杂化,探讨多组数据的比较。论证某复方中药提取物对大鼠肾损伤的修复作用,研究者将随机大鼠分为三组:正常空白对照组、肾损伤模型组空白组、肾损伤模型复方中药修复组。以AGF(mg/L)指标作为疗效评价指标(正常组较低,肾损伤后AGF指标上升),分别在治疗前、治疗后测量AGF 值,获得相应的数据,请评价复方中药提取物对肾损伤的修复效果如何。数据库为AGF.sav
案情分析
如同上篇小统计大文章(上),本案例先基于PICOS框架分析案情本案例是一个基本但是经典的临床试验研究案例,具备了所有的PICOS要素。
统计分析策略
本例是随机化多组比较分析,一般可以采用的方差分析探讨组间差异性。但由于类似于“小统计大文章”上篇,本例存在着治疗前的基线数据。因此,可根据基线数据做点文章。现在本例治疗后的AGF作为结局指标,如何来结合基线数据开展统计分析来评价效果呢?想象一下,如果复方中药相对对照组是有效的,理想上数据的结果,应该如何?如果你看过“小统计大文章”上篇,你大概就能够基本理出个思路了。在纳入基线数据后,统计分析可从类似的四个层面来开展,从而得到可信的医学证据。第一,基线可比问题 既然是实验性研究随机化分组,我们一般能够验证分组均衡性,因此第一步可以分组均衡性的比较。不同于上篇,这里基线数据是不平衡的。为什么?因为基线有两组是肾损伤的动物模型,一组是正常空白对照的大鼠,肾损伤大鼠AGF一般要高于空白对照组。但是,模型空白组和中药组应该相似。第二,实验后横向差异性问题。横向比较指的是同一个时间点不同组的比较。实验后的AGF应该不同,特别是模型空白组和模型中药组,两组AGF应该存在着统计学差异。第三,实验前后差异性问题。有了基线数据,研究可以开展前后比较分析,研究药物对自身的影响。本例理想的情况如何呢?一般情况下,对照组不一定有差异,但是复方中药组治疗后相比治疗前AGF水平应该下降,并存在着统计学差异。最后,差值差异性问题。干预组前后差值和对照组前后差值有没有统计学差异。 这一比较不仅可以提供一部分信息,还可以在第二步没有差异的情况下,也许可以提供对效果有利的信息。根据上述的统计分析思路,每一步应该用什么统计学方法呢?第一,基线可比问题 大鼠实验前多组AGF总体上没有统计学差异,是三组独立数据的比较,统计方法可考虑F检验或者多样本秩和艰难眼。如果有兴趣,还可以进行多重比较,看基线到底怎么个可比法。第二,实验后横向差异性问题。实验后后空白正常组、模型空白组、中药组的AGF比较,同样也是F检验或者多样本秩和,再辅助以多重比较的方法。第三,实验前后差异性问题。治疗前后AGF有没有统计学差异?配对设计,应该用配对t检验或者配对秩和。第四,差值差异性问题。空白正常组、模型空白组、中药组前后差值有没有统计学差异?三组差值的比较,也可用F检验或者多样本秩和检验!因此,总结来说,由于增加了基线数据, 该数据在方差分析的基础上,可浪点水花,比如配对t检验,比如差值的分析。根据统计分析策略,要利用SPSS进行以下内容的操作:1计算差值,2正态性检验,3治疗前进行差异性分析及多重比较,4治疗后进行差异性分析及多重比较,5治疗前后进行分析,6两组差值进行分析及多重比较。
计算差值
计算差值可以通过SPSS“数据-计算变量”来实现:d=治疗后AGF-治疗前AGF。最终数据库会增加新的一列,变量为d。
正态性检验
多组数据比较、配对设计数据的比较均需要满足正态性的要求,因此需要要考虑治疗前、治疗后的正态性,也要考虑差值的正态性,所以需要开展三者的正态性检验。结果显示,治疗前AGF、治疗后AGF、治疗前后AGF差值各组数据符合正态分布的前提(P>0.05)。
治疗前、治疗后差异性比较
由于正态性符合,两组治疗前和治疗后的比较,同时采用多样本方差分析进行,同时可以开展多重比较(①事后比较)采用方差分析发现,无论治疗前还是治疗后,三组AGF指标总体均数均存在着统计学差异(P<0.05)。采用邦弗伦尼(Bonferroni)进行多重比较发现,实验前基线AGF方面,空白对照组与中药组有统计学差异(P<0.05),而模型空白组和模型中药组无统计学差异(P>0.05)。实验后的AGF方面,中药组与模型空白组存在着统计学差异(P<0.05),而与正常的空白对照组无统计学差异(P>0.05)。
治疗前后配对资料的统计分析
由于正态性符合,可采用配对t检验,分别比较三处理组实验前后AGF的差异。(1)为了实现上述目的,在配对t检验,首选需要“拆分文件”。拆分文件操作路径为“数据--拆分文件”。(2)选择“比较组”或者“按组织输出”(两个结果一样,形式不同),分组依据纳入“实验分组(group)”。(3)拆分文件之后,进行配对t检验。详细的方法可见配对t检验这一讲配对t检验得到以下结果:空白组P=0.423,差异无统计学意义,肾损伤模型组P=0.068,差异无统计学意义,肾损伤修复组实验前后的AGF差异统计学意义(P<0.001)。
两组AGF改变量比较分析
针对实验前后AGF差值d,由于正态性条件符合,可采用多样本F检验比较分析结果显示,三组数据差值的F检验P<0.001,差值差异具有统计学意义。
采用邦弗伦尼(Bonferroni)进行多重比较发现,中药修复组与空白对照组存在着统计学差异(P<0.05),中药修复组与模型空白组存在着统计学差异(P<0.05)。
SPSS分析总结
第一步,基线可比? 达成!模型中药组和模型空白组无统计学差异。第二步,实验后横向有异?达成!模型中药组和模型空白组存在着统计学差异。第三步,实验前后差异性?达成!模型中药组实验前后AGF有差别。第四步,差值差异性分析。达成!模型中药组的前后改变量最为明显,与其它两组存在着差异。因此,不同于“小统计大文章”上篇结果的矛盾性,本例综合4步骤的结果,可以认为中药复方的疗效存在。三组小鼠的AGF指标分析发现,治疗前AGF指标总体上存在着统计学差异(F=15.17, P<0.001),其中,空白组和模型组、中药组有统计学差异(P<0.001,P<0.001),中药组和模型组无统计学差异( P=0.659)。治疗后AGF指标总体上有统计学差异(F=17.90, P<0.001),其中,模型组与空白组、中药组有统计学差异(P<0.001,P<0.001),中药组和空白组无统计学差异(P=0.977)。空白组和模型组实验前后AGF指标无统计学差异(P=0.423,P=0.068),中药组实验前后具有统计学差异(t=5.66,P<0.001)。30天学习医学统计学与SPSS课程系列连续更新了2期“小统计大文章”,总字数接近10000字。两期只采用了t检验或F检验,探讨了随机对照试验干预措施的效果。这两篇充分结合科研设计思路和统计分析策略,是以医学实验性研究最基础、但最经典的研究范式,其统计策略亦是如此。两篇文章很值得学习。学完了统计学,还不能灵活将各种策略整合一起开展数据分析的朋友,有必要研究下两篇文章的统计分析策略,我相信肯定有收获。统计分析策略不仅仅是是SPSS或者假设检验方法,而是关于实验性研究的世界观。什么是真?如何证明真?统计分析策略是一整套解决方案,它面对数据库,聚焦于研究目的,为朝着提供可靠的医学证据提供一系列过程与方法。统计分析策略思考,也是一场艰苦的修行。统计方法万万千,如何选择统计方法形成我们的解决方案呢?你得从研究设计、数据的类型、分布、随机化方式、样本量等等诸多考虑中苦苦寻觅最合适通向彼岸的路径。统计分析策略不等于复杂统计方法。很多时候大文章只需要小统计即可,医学顶级期刊《新英格兰医学杂志》用t检验、卡方检验评价临床效果的文章比比皆是。因为,花里胡哨的统计学并不能带来特别的效果。成功的医学研究,关键在于研究设计的科学性、规范性,关键在于根据数据特征选择合适的方法。一个良好设计的随机对照试验成果,哪怕小样本,单中心,哪怕只采用t检验,只要严格遵从医学科研设计和统计分析方法原则与方法,《新英格兰医学杂志》刊登也不是梦!