最小临床重要性差值(minimal clinically important difference, MCID)
目前,临床研究中常用各种量表来评估患者的治疗效果,比如脊柱外科常用的VAS、ODI、JOA和NDI等量表。作为一种评价临床疗效的手段,量表可以将患者的主观感受转化为客观分数,将疗效量化并直观的体现疗效的变化。
对于量表结果的解释,通常用P值来判断。从数理统计的角度来看,P值大小的最重要影响因素是样本含量和组间差异大小。再微小的差异,达到足够大的样本量和测量精度,都能得到有统计学意义的P值;再大的差异,在样本量过小和测量精度不那么高的时候,也可能只能得到P>0.05。现在,越来越多的学者意识到仅根据治疗前后量表得分差异的假设检验P值来判断疗效是不科学的,P值有统计学意义不代表其有临床意义。所以,在临床研究中不应该唯P值是论,单看P值大小并不代表临床差异大小。
假设检验只是帮助我们解决我们看到的差异是否来自随机误差这个统计问题,但是这个差异是多大、差异是否有临床意义这一点是假设检验无法解决的。临床意义显著性主要关注的是效应大小,而统计学学显著性主要关注的是P值。真正有临床意义的研究,不仅需要证明统计学角度有意义,更应该明确临床角度的获益程度。
那么,量表应用究竟发生多大的变化,才被认为治疗是有效的呢?换一句话说,量表得分要改变多少才具有临床意义呢?为解决这个问题,最小临床重要性差值(minimal clinical important difference, MCID)这个概念应运而生,这也是目前很多小伙伴在投稿时,审稿专家常提出的问题。你的临床研究,治疗前后或两组各种量表差值有没有达到MCID,如没有达到,则说明你的研究虽然有统计学意义,但可能没有临床意义。
其实国内学者在进行临床研究时,很少关注MCID,在国内发表的相关的中文文章中可见一斑。现在,SCI期刊对于临床研究,越来越关注MCID。
1987年,最小临床重要性差值(MCID)的概念首次被提出,随后1989年,加拿大学者Jaescllke R等人对其进行定义,认为MCID是在不考虑副作用和成本的前提下,被病人认可的最小问卷维度得分变化值。如果临床研究中,我们进行了假设检验P<0.05,而且差异大于MCID;那么就可以肯定这两组差异既有统计学意义,又有临床意义。所有量表得分变化大于MCID的患者均被称为“有效者”,“有效者”在所有患者中的比例直接反应治疗的效果。
然而,目前MCID的制定国际上仍无金标准,现有的MCID的计算方法都存在一定的缺点和局限。传统方法主要有2种,包括效标法(anchor-based approach,又称锚法)和分布法(distribution-based methods)。近年来,不断有新的方法被提出,如:基于锚的MIC分配法、线性回归模型和logistic回归模型等。
目前,脊柱外科领域常用锚法计算MCID,但受限于小的样本量,各个研究得出的MCID差异有时候高达2-3倍。2005年,Ostelo等进行文献综述得出VAS、ODI等量表在腰痛患者中的MCID。
随后,2008年,一项腰痛疼痛程度和功能状态测量的专家共识给出了相关量表的MCID。
2017年发表在Spine上的一篇综述,Chung等回顾了2011-2015年Spine, Spine J, Neurosurgery-Spine和Eur Spine J四个杂志所发表的所有报道结果得分(PRO)的临床文章,并发现16.6%(264/1591)的临床文章提出或引用了MCID。其中22/264 (8.3%)篇独立计算了MCID,156/264 (59.1%)篇使用先前发表的MCID值作为自己结果的衡量标准,而剩余的86项研究仅简短提及MCID,但没有应用MCID。此外,大多数研究(97.2%)使用的是通用MCID,少数研究使用了特定MCID。
腰椎相关量表的MCID见下表:
颈椎相关量表的MCID见下表:
脊柱畸形相关量表的MCID见下表:
2019年,发表在SPINE的研究发现,退行性颈脊髓病患者的JOA评分的MCID为2.5。
因此,在进行两组患者的疗效对比的时候一定要注意查查自己研究领域里是不是已经有公开发表的MCID,尤其是特定MCID。虽然上述相关研究得出的结论目前仍存在争议,但是脊柱外科通用的VAS评分MCID大致在2-3分,ODI在10左右,NDI在6左右,而JOA在2.5左右。在写临床文章下结论的时候,我们不应只看P值,还要看MCID。关注两组间差异值是否大于MCID?只有大于MCID,才能说有临床意义。此外,也应关注效应量和可信区间,如OR值、RR值、HR值、95%CI等,应与P值同时报道,这些信息往往比P值本身更有意义。