【Meta分析】不同类型数据转换方法
系统评价/Meta分析指全面收集所有相关研究并逐个进行严格评价和分析,再用定性或定量合成的方法对资料进行处理得出综合结论的研究方法。在指导学员的过程中发现初学者在学习过程中常常会碰到许多共性问题,本公众号特此开设专栏解答,希望能够和大家共同学习交流Meta分析,共同成长,如有不当之处,还请大家批评指正。本期我们分享的是数据转换处理的几点经验。
01
序言
概述
基线值、终点值和改变值
因此总的来说处理连续性变量数据的方法:
提供了前后改变值,直接进行提取
提供了基线值和终点值,可通过公式进行换算成改变值
仅存在终点值时,可利用终点值进行亚组分析
掌握了总的原则后,在实际情况中,如何掌握不同类型数据的转换方法进行换算呢?
标准误和可信区间
进行此转换时,必须从单个干预组内计算SE,并且不得为两个干预组之间的均值差的SE。平均值的可信区间也可以用于计算SD。同样,以下内容适用于干预组内计算的平均值的置信区间,而不适用于干预之间差异的估计。大多数报告的置信区间是95%的置信区间。如果样本量较大(每组样本均大于100),认为数据符合正态分布,则如果样本量较小(每组均小于60),则应当使用一个t分布值来计算。t分布值可以用自由度(等于组样本量减去1)从t分布表得到。有关t分布的详细资料可从许多统计学书附录或标准的计算机电子表格软件包获得。例如样本量为25的95%可信区间的t值,可通过键入=tinv (1-0.95,25-1)在Microsoft Excel电子表格的单元格里而获得(结果是2.0639)。上述公 式中的除数3.92将改为2×2.0639=4.128。
中位数和四分位间距/极差
当数据分布对称时,中位数与均数很类似,因此中位数有时直接用于Meta分析。然而,当数据偏态分布时,均数和中位数可能有很大的不同,经常以中位数和四分位间距或者极差的形式进行报道,当样本量较大且结果的分布与正态分布相似时,四分位数范围的宽度将约为1.35 SD。在其他情况下,尤其是当结果的分布偏斜时,则无法从四分位间距估计SD。因此,如果样本量较大,则可以通过(四分位上限-四分位下限)/1.35表示SD,用中位数代表Mean,当样本量较小时,以数据难以获得的原因排除这篇文献。而极差是非常不稳定的,且随样本量增加而增大,它描述的是观察结局的极限值而不是平均变量,不应当用来估计标准差。但是大家也可以使用Cochrne官方推荐的Wan等开发的Excel计算器工具进行相应的换算,需在论文中注明相应的方法学,并进行敏感性分析看结果是否稳健。
合并值
有时希望将报告的两个亚组合成一个组。例如,如果一个研究分别报告了每一个干预组中男女的样本量、均数和标准差,就可以如此做。这个公式也适用于多个干预组比较的研究,可将两个干预组合并成一个干预组。例如,第1组和第2组可能是一个干预措施的两种变异形式,而参与者被随机分配入其中一个组。
那么这么多数据转换如何简便的去进行换算呢?其实有非常聪明的科研工作者已经为我们整理好了科研工具,我们只要输入数字,结果自然来,不用去死记硬背公式进行计算。
循证医学数据提取的数据换算神器
该神器由胡东才医生参考刘鸣等主编的《系统评价、meta分析设计与实施方法》,分享至丁香园,原帖链接见https://www.dxy.cn/bbs/newweb/pc/post/27459600,主要整理了10种类型的数据转换方法,并且均附加了说明,在使用时需要严格参照适用标准进行数据的转换,但是不足之处该表年份较久,很多Cochrane Handnook的更新没有跟上,例如我们刚刚提到的Cochrne官方推荐的Wan等开发的Excel计算器工具进行四分位间距和极差的数据转换,同时该表对于两组之间的终点值-基线值计算改变值时相关系数直接取0.5目前也具有争议,在使用时大家需注意甄别,根据目前最新的研究成果调整自己的数据处理流程。
CMA软件
同时该软件还支持亚组分析、Meta回归功能,堪称傻瓜式Meta分析软件,在使用中,不用花时间去考虑数据转换的问题,而直接去实现Meta分析的操作,但缺点在于仅提供10天的试用,想要完整使用只能购买或者求助淘宝。