懵了! 临床试验基线随机分组后仍然不均衡怎么办?这篇JAMA文章给了示范

随机对照试验(RCT),往往采用随机化方法,将人群分为干预组和对照组,开展临床试验。一般情况下,概率学可以证明,干预组和对照组分组是均衡,这个就是所谓基线可比性。但是,也恰恰基于概率学原理,总有一定的概率(比如5%),会出现基线有些指标分组不均衡。
基线分组均不均衡,可不可比,可以采用诸如t、卡方、秩和检验分析组间差异性,凡是组间没有统计学差异,则可以说明基线均衡。
所以,我们经常看到中文文章关于人群基线时,有这么一句话:
那万一。。。。不对,不止万一,可能是百一的概率。。。。有些基线指标分组不均衡怎么办?
郑老师的统计百宝箱告诉你:我至少有3种思路供你参考:
1. 第一种方法:如果基线分组不均衡,而基线指标和评价结局指标是同个东西,比如治疗前血压是基线,结局指标是治疗后指标,那么计算治疗前后差值或者比值开展研究吧!具体可以见郑老师的文章。
小统计大文章(上) | 30天学会医学统计与SPSS公益课(D8)
2. 可能让你大跌眼镜的主流方法:熟视无睹!
我们中国人写RCT文章,喜欢开展基线的差异性比较,来论证基线是否可比。但你不知道,现在世界上的主流临床杂志论文:基线不需要进行比较,多此一举,只要你是真随机对照研究。
他们认为,最终基线可比性是要通过P值来表现。但这个P值受到样本量影响很大,样本量很大时,哪怕基线分组很均衡,P也可能<0.05,如果样本量很小,分组不均衡P>0.05,所以P值也难以判断。
那么干脆不比较了,既然你是真随机,那么基线就应该分组均衡的 !
所以很多RCT文章,只描述,而不进行差异性比较,比如典型的表格如下:
3. 第三种方法,那就是控制法了。
一般利用回归的方法进行控制,淡化基线不均衡带来的影响。这里我就引用一篇JAMA刚发的一篇新冠肺炎治疗的文章。看看作者怎么用回归控制的,而关键,我们要学习下作者如何描述这个过程的。
论文的基本概况
这项发表在JAMA杂志的研究,探讨了维生素D3给药对COVID-19中度至重度住院患者住院时间及其他相关临床结局和不良事件的影响。
这是来自巴西的一项多中心、双盲、随机、安慰剂对照试验,该研究纳入了2020年6月2日至2020年8月27日入院时患有中度至重度COVID-19的240名患者。患者被随机分配接受单次口服剂量200 000 IU维生素D3 (n = 120)或安慰剂(n = 120)。主要终点为住院时间,定义为从随机分组日到出院的时间。
由于是时间结局,往往采用的方法是生存分析方法。我们等下来讲讲它的统计方法。
结果发现,维生素D3组(7.0[4.0-10.0]天)和安慰剂组(7.0[5.0-13.0]天)的中位住院时间无统计学差异(logRank P =0 .59)。其他结果包括,维生素D3组和安慰剂组的住院死亡率无统计学差异(7.6%比5.1%;差异2.5%[95%CI,–4.1%-9.2%];P =0 .43),重症监护病房入院率为16.0%比21.2%(差异5.2%[95%CI,–15.1%-4.7%];P = 无统计学差异.30),需要机械通气的比率为7.6%对14.4%(差异,–6.8%[95%CI,–15.1%-1.2%];P =0 .09)。
上图:主要结果的生存曲线,可见趋势相似

上表:次要结果的所有的P>0.05
这个结果毫无意外地证明了补充大量维生素D是没有用途的!
统计学解决方案
本篇文章主要结局是生存结局,往往采用的方法是生存分析方法。以下这段关于生存分析方法的文字,是非常值得学习的,我们在撰写统计报告的时,也可以进行模仿。

郑老师来解构下:
首先,秉持小统计大文章的理念,RCT用的统计学方法也不复杂,由于本研究结局是生存时间,那么采用的方法便是logRank(进行差异性分析) 和Kaplan-Meier(绘制生存曲线)
其次,关键的东西来了,面对可能存在的由于不完全随机化带来的混杂偏倚,我们采用Cox回归分析来进行调整。这个潜在混杂偏倚的鉴定方法是基线差异性比较P<0.2。混杂因素包括了疼痛、高血压、糖尿病等指标。
这句话,除了第一个词Post hoc可以省略之外,其它所有的文字简直就是我们今后统计分析文字书写的模板。
我给你先来一段:
Cox回归的:

Adjusted analyses for the primary outcome of length of stay were performed using Cox regression models to estimate hazard ratios (HRs) with corresponding 2-sided 95%CIs, considering potential confounders that were not fully balanced by randomization, prespecified as P < .20 for baseline comparisons between groups.These confounders were jointpain, sore throat, hypertension, diabetes, parathyroid hormone, and creatinine.

然后logistic回归:

Adjusted analyses for the primary outcome of length of stay were performed using Logistic regression models to estimate odds ratios (ORs) with corresponding 2-sided 95%CIs, considering potential confounders that were not fully balanced by randomization, prespecified as P <0.05 for baseline  comparisons  between groups. These confounders were jointpain, sore throat, hypertension, diabetes, parathyroid hormone, and creatinine.

漂亮不?拿去用吧!不谢!
不闲的郑老师的“闲来郑语”

第一,我觉得我们开展RCT,还是实事求是,随机就是真随机
第二,RCT研究千万别怕分组不均衡
第三,RCT研究基线可以不进行分组均衡性比较,你敢吗?中国学术期刊会跟上吗?
第四,RCT研究是小统计大文章,但是也不妨碍协方差和回归方法的锦上添花。

更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.2006-2020中国卫生统计年鉴完整合集免费下载
6.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
7.“如何在90分钟学会统计分析?” 来下载PPT学习吧!还有免费直播视频
特别提醒:上述资源每天限分享和下载一个。

培训通告

2021年,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班。如果您有需求,不妨点击查看:
来参加吧,通俗易懂的统计培训课:R、SPSS、Meta、重复测量以及量表分析
如果您觉得文章不错,
为我们打“call”,
点击“分享”吧
(0)

相关推荐