NEJM:临床研究统计分析的要求和报告规范
所有稿件都应在“方法部分”,交代缺失数据的处理方法。除非缺失非常罕见,否则,所谓“包括所有病例”的分析是不可能的,所以是不可接受的,研究者应该根据数据缺失的原因或机制采取适当的处理方法。
比如,对于随机缺失的数据,可采用多重填补法(multiple imputation)或逆向概率加权法(inverse probability case weights);如果缺失数据不是随机的,且有一定的规律性,可采用基于模型的填补方法。本杂志关于临床试验缺失数据处理的一般原则,可参见2012年本刊发表的Wareet及同事的方法学文章 (N Engl J Med 2012; 367: 1353–1354)。
论文在提供统计学检验P值的同时,还必须提供有关效应值、关联强度或其它结果指标的可信区间。可信区间不应局限于95%,而是应根据调整过的一类错误值的大小做相应的调整。[比如,多重比较时可能选用0.001作为一类错误值,那么可信区间就应该根据0.001来计算。——译者注]
除非研究问题和研究设计特别要求单侧统计学检验,如非劣效性临床试验,那么所有研究都应提供双侧检验的P值。一般情况下,P值大于0.01时,其数值只需保留小数点后两位;如果在0.01到0.001之间,其数值只需保留小数点后三位;如果小于0.001,则统一用P<0.001表达。当然,有些场合也需要变通,比如预先设有中止条件的临床试验,或是全基因组的关联性研究。
对结果的报告不需超过一个特定样本量的研究可提供的科学上的或临床实践所需要的精度。比如,对于测量关联的OR(odds ratio,比值比)的报告,小数点后一般保留两位即可,例如OR=2.18。对于模型分析的结果,如回归分析中的回归系数,小数点后保留合理的位数即可,不可过多。
除特殊情况外,临床试验对主要结局的分析一般都应与最初计划的分析方案保持一致。如果二者不一致,应在稿件的方法部分中说明理由。此外,有时杂志可能会要求作者进行一些研究最初计划外的统计分析。
在确认性分析中,当进行多组比较时,研究者应该遵守研究方案和统计分析预先计划的程序,以控制一类错误。比如,具体可采用邦费罗尼校正法(Bonferroni adjustments)或事先制定的[按照比较的重要性排序的]序贯比较法(hierarchcal testing procedures)。多重比较的P值应在文章中如此标明。如果采用序贯比较法,只需报告最后一个有统计学意义的及其之前的P值,无需报道第一个没有统计学意义的及其之后的所有P值。对于预选设定的探索性分析,研究者应该按照统计分析方案预先规定的方法来控制假阳性错误出现的概率,例如Benjamini–Hochberg法。
如果临床试验统计分析计划中没有写明多重比较时采用哪种方法来控制一类错误,即没有说明如何控制假阳性结果出现的概率,那么针对所有次要和探索性结局的分析,只需报告治疗效果的点估计及其95%置信区间,无需报告相应的P值。在这种情况下,文章的“方法部分”应注明,可信区间的宽度没有做多重比较的调整,不能保证结论的外推性。
有关细节可参考Wang和同事推荐的亚组分析方法 (N Engl J Med 2007; 357: 2189–2194) 。如果一个亚组分析是统计分析方案中预先计划好的,那么有关分析就必须按照预先规定的方法进行。如果研究者事后认为一项没有预先计划的亚组分析是重要的,那么必须给出合理的解释。而且,文章必须标明那些事后分析的结果。
森林图常用来展示亚组间干预效果一致性(或异质性)的情况,对于呈现不同亚组的效果非常有用,我们建议研究报告应包括所有重要亚组分析的森林图(参见下图)。但是,如果亚组样本量比较小,对组间结果一致性的推论就不可靠了。另外,多种变量与治疗间交互作用一一分析的P值,存在多重比较的问题,推论价值有限,一般都不用报告。
3)对观察性研究的特殊要求
观察性研究结果的可靠性取决于几个重要的假设,其中包括研究对象的选择、被测量和没被测量的混杂,以及控制混杂方法的有效性。文章的“方法部分”须描述研究的设计和分析是如何具体处理这些以及其他有关问题的。