神奇的文章!一篇通篇没有P值的《新英格兰医学杂志》临床试验论文是如何出品的? 2024-08-01 23:09:24 临床研究的统计学方法总体上较为复杂、细致。一篇优秀的论文,往往结合多种方法,特别是3期临床试验。我们估计更不敢想象,一篇临床3期论文,居然通篇没有一个P值。2020年3月,医学期刊排名第一的《新英格兰医学杂志》(NEJM)发表了一篇非常有意思的论文:这篇临床3期试验论文,通篇真的没有一个P值。此外,它全文主要统计学方法就一种:CMH方法。感觉神奇吧。实际上很多时候,小统计就能出大文章,统计方法并不需要高级货。研究背景这是一项关于HIV治疗新药的临床研究。艾滋病是由于HIV病毒感染引起的严重疾病,曾经被认为是无药可治的致命疾病。然而在上世纪末,随着何大一教授等人开创的“鸡尾酒疗法”的建立,艾滋病已经成为能够被药物控制的慢性疾病。但是通常“鸡尾酒疗法”要求日服药物,副作用不小,较为麻烦。现在有一种新的“鸡尾酒疗法”,Rilpivirine Cabotegravir双药组合。它的优点是,注射一次,长期发挥作用(Long-Acting)。于是,研究团队想知道,新的双药组合虽然服用频率降低,效果是否还凑合?本文的研究方案首先,我们不妨基于PICOS原则,了解下本文的研究方案研究设计(Study)这是临床3期,多中心、随机、同期、开放、非劣效性研究研究对象(Patient)2016年10月到2018年8月,纳入先前未经治疗、HIV-RNA 拷贝数>1000/ml的HIV-1 感染者参与,最终合格患者数为566例。采用分层区组随机法,分为Rilpivirine Cabotegravir双药组和“鸡尾酒疗法”疗法组。分层因素为性别和HIV-RNA 拷贝数。干预和对照(Intervetion & Control)所有患者首先接受16周的传统抗病毒诱导治疗,然后HIV-RNA拷贝数低于50/mL的患者随机分组,分为继续接受传统抗病毒口服药物治疗(对照组)、或接受Cabotegrator-Rilpivirine治疗(先口服1个月,随后接受每月1次注射治疗)。结局指标(Outcome)本试验的主要研究终点是研究的主要终点为48周后HIV-RNA拷贝数高于50/mL的患者比例。关键次要结局为48周后HIV-RNA拷贝数低于50/mL的患者比例。小结:患者分为两组,结局指标是有效率(或者无效率),一个简单的两组率比较。此外,关键的特点是该研究是一项非劣效性研究。研究结果结果发现,第48周,双药联合治疗的干预组283名患者中,有6名(2.1%)HIV-RNA拷贝数高于50/mL,而传统“鸡尾酒”口服治疗组中有有7名(2.5%)高(调整后的差异为-0.4%),与非劣效界值差异具有统计学意义。在第48周,93.6%接受长效注射治疗的患者和93.3%接受口服治疗的患者的HIV-1RNA拷贝数低于50mL(调整后的差异,0.4%) ,与非劣效结局差异具有统计学意义。在接受长效注射治疗的参与者中,86%报告注射部位反应(中位持续时间,3天;99%的为轻度或中度),4名参与者因注射相关原因退出试验。组间不良事件率相近,91%的患者对长效注射治疗感到满意。该研究结果,通篇文字描述没有P值。不仅如此,论文的表格同样没有P值(1) 基线,两组数据统计描述,无P值(表2)(2)主要结局表格,无P值(表2)关键分析:为什么临床3期论文可不用P值呢?中国的医学研究者一般会认为,一份文章能否发表,非常重要的评价指标就是P值。P<0.05结果阳性,表明临床研究是成功的,P>0.05,想死的心都有了。然而,目前国际上越来越多的杂志、统计领域的学者不再看重P值,甚至宣称要判定P值死刑。我这里就从以下几点论述本文P值为何缺失。RCT研究表1(Table 1)结果无须报告P值通常情况下,临床试验论文首先要做的工作是进行基线的特征的描述,并进行组间的均衡性比较,看分组是否均衡(计算P值),这一结反映的在论文的第一张表格中(Table 1)。但是,现在越来越多的杂志和学者认为,随机对照试验(RCT)论文,表1只要进行统计描述就行了,无须进行均衡性比较,无须用P值来反映基线是否可比。为什么?有以下2点理由:第一,规范的随机对照试验,它就应该被认为是均衡可比的,采用意向性分析前无须进一步去论证其均衡性;2)P值无法有效反映分组均衡性,因为小样本,即便是不均衡性的数据,P值也很可能>0.05,而大样本,即便是均衡性的数据,P值也很可能<0.05。与P值相比,置信区间更为重要P值和置信区间统计分析结果基本相同,国人一般较认可P值。P值<0.05,说明结果阳性,皆大欢喜。现在越来越多的学者认为置信区间更重要,反而P值不太重要。本文便选择置信区间来判断结果是否阳性。分析表明主要结局方面,48周后HIV-RNA拷贝数高于50/mL的两组患者比例之差(率差)95%置信区间为(-2.8-2.1)。次要结局方面,48周后HIV-RNA拷贝数低于50/mL的的两组患者比例之差(率差)95%置信区间为(-3.7-4.4)。一般来说率差的95%置信区间包括0值,则差异没有统计学意义。本文主要结局和次要结局95%置信区间都包括0,说明新药联合和传统鸡尾酒口服方法效果差不多。“效果差不多”,能否说明长效双药联合的治疗方法达到了非劣效目标了吗?不能!如何利用P值和置信区间判断非劣效性非劣效性研究是探讨干预组是否效果不太差于对照组的研究。本文的阳性率的研究中,就是探讨率差是不是不太低。本文假定传统鸡尾酒疗法48周后HIV-RNA拷贝数高于50/mL的患者比例2%,非劣效界值为6%。这意味着,长效药物组中,HIV-RNA拷贝高于50/mL的患者比例不高于8%就可以实现非劣效(或者率差小于6%)的目标。这一目标,可分别通过假设检验(P值)和置信区间来论证。假设检验(单侧)的方式: 此时,采用单侧率的比较(正态近似法)可获得P值;P<0.05,则非劣效目标达成。置信区间的计算更加直接明了。就是看率差的置信区间是否包括了6%。上述“工字型”即为率差置信区间的上下限,(1)区间上下限包括差率0%(本文的数据),但没有包括6%,(2)区间上下限包括差率6%,(3)区间上下限不包括差率6%,都低于6%。相对6%的非劣效界值,其中(1)结论为非劣效,(2)为不能说明结论非劣效,阴性结果,(3)劣效结果。由此我们便可以初步判断本文长效双药组合结论为非劣效。本文为什么没有同时报告P值呢?正常情况下,论文P值和置信区间需要同时汇报。但本文却只汇报了置信区间,原因恐怕与统计学方法有关。一般诸如t,z检验,均可开展非劣效的置信区间估计和P值的计算。但是也有诸多方法,往往只进行差异性比较和置信区间估计。比如本文采用的CMH方法(Cochran–Mantel–Haenszel analysis)。文章采用CMH方法进行计算95%置信区间CMH方法,又成为分层卡方分析。一般来说,两组率的比较,可以采用正态分步分布z分步法进行率的比较或者卡方检验,但是临床试验,虽然分组均衡,由于采用的是分层随机设计,往往会进一步借助CMH方法进行分层卡方检验,进一步控制潜在的混杂因素(本文是性别和HIV-RNA 拷贝数)。所以诸位可以看本文的表(2)有Difference 和Adjusted Differene 两者结果,前者未分层,而后者采用了CMH调整了潜在的混杂因素。CMH方法能够计算出P值,来探讨两组率是否有统计学差异。不足的地方在于,该P值是差异性的P值,而非非劣效检验的P值。本文CMH差异性检验的P值应该>0.05。这一结果不仅多余,而且会给读者带来误导,所以干脆不放入文中。所以,这就造成了通篇论文没有一个P值的线性。总计其原因,便是基线数据分析无须P值,置信区间和P值地位同等重要,非劣效检验置信区间结果更直观,CMH方法P值会带来误导。闲来郑语这里我只说三句话:第一,很多时候,置信区间就足够了,它比P值更重要第二,临床试验,往往是小统计大文章第三,规范分析比复杂统计更重要-本文结束- 赞 (0) 相关推荐 春暖花开压马路,败家剁手压心率 『跑你』,RunYouRunMe,给跑步亲们带来各种实用Tips,新人血泪教训&老鸟亲身体验.诸多从入门到进阶各种原创实用大全,让亲们更健康不受伤. 文 | 老Q 一些新鲜跑友可能经常会看到一 ... 第26讲:《定积分的性质与微积分基本公式》内容小结、课件与典型例题与练习 一.定积分的主要性质及使用说明 1.线性运算性质 (1)常数可以提到积分符号外面来计算积分: (2)函数和与差的积分等于积分的和与差:反过来,积分上下限相同的两个积分的和与差等于两个积分的被积函数的和 ... 如何找到适合自己的运动强度 " 利用关键数据,找到适合自己的运动强度,并指导健康运动的实践." "适合自己"和"以心率来监控运动强度"这两个观点,几乎是贯穿我所写的所有 ... R语言区间数据回归分析 原文链接http://tecdat.cn/?p=14850 回归分析是一种十分常见的数据分析方法,通过观测数据确定变量间的相互关系.传统回归分析以点数据为研究对象,预测结果也是点数据,而真实数据往往在 ... 斑块破裂和修复失衡:ACS发病新理念!新英格兰医学杂志文章 <新英格兰医学杂志>发表的一篇文章指出,急性冠脉综合征很可能是因为斑块破裂和修复的平衡被打破. 文章认为,发生急性冠脉综合征可能需要"双个条件".第一个条件是斑块破 ... 小统计大文章 !一个阴性结果,如何能够发表在《新英格兰医学杂志》? 我常说"小统计大文章",意思是很多时候好的临床试验文章,不需要复杂的统计学方法.今天说的一篇论文就是如此.但是简单的统计学,非常重要的是要遵守统计分析规范和写作规范. 我看到很多临 ... 《新英格兰医学杂志》2019文章与《中华外科杂志》1987报道的时空穿越 2019年春节,我像往常一样,利用假期阅览国际医学期刊上的文章,Science.Science TM.Nature.Nature Medicine.Nature Genetics.Nature Bio ... 教师成长必读文章1500篇(中) 在互动教研中促进教师发展 教师成长需要有效引领 如何成为智慧名师 新课程下的初中数学优秀教师发展标准 新教师专业能力透视:新教师如何才能加速度成长 新课程改革背景下教师专业化发展误区及对策 教师的五个 ... 教师成长必读文章1500篇(上) 教师一生需要思考的十个问题之一:为什么做教师? 造就卓越的教师(1) 教师一生需要思考的十个问题之二:怎样看待教师职业? 造就卓越的教师(2) 教师一生需要思考的十个问题之三:怎样做教师? 造就卓越的 ... 太神奇了,一篇作文定中考!这是很多学神一... 太神奇了,一篇作文定中考!这是很多学神一招制胜的秘密武器. 这些年带过一些中考满分作文的学生,作文的立意非常重要.对满分作文,高分作文,进行了总结,下面几个方面的主题很容易拿高分. 1. 和 ... 6篇通篇只有一个读音的奇妙古文,不看译文很难读懂! 中华文化博大精深! 6篇通篇只有一个读音的奇妙古文,不看译文很难读懂! 1.<季姬击鸡记> 季姬寂,集鸡,鸡即棘鸡.棘鸡饥叽,季姬及箕稷济鸡. 鸡既济,跻姬笈,季姬忌,急咭鸡,鸡急,继圾几 ... Power BI 系列文章20+篇,新春归来更努力,2019,更Power! 刚打开地图,发现所有向珠三角方向的高速都在某些路段上有"深红"色拥堵! 我其实是年初四就从家乡出发返回广州,而路上也有些堵了,我们还说,今年是不是已经提前堵了?但是,实际上,目前看 ... 批量汇总多Excel文件数据系列文章12篇,助你变成老司机,轻松躲坑666! 正确姿势 PQ批量汇总Excel文件就是这么简单 PQ-综合实战:结合CELL函数实现数据源的动态化--含汇总当前Excel工作簿多表数据操作动画 躲坑注意 Power Query(BI)里能一键合并 ...