【1114.】先单后多风险因素发现模型构建论文错误解析
后台有粉丝让解读一篇文献,题目如下:
该文受试对象90例,发生死亡24例,存活66例,探讨死亡的危险因素。摘要如下:
松哥统计说
表1:作者对两组感染性休克患者的基本资料进行比较,4项基线指标P>0.05。说明基线可比。看似非常完美,但是
松哥认为,本研究为观察性研究,非干预性随机分组研究,无需进行基线可比的检验。如果基线可比,其实业就排除了上述4项指标对死亡结局的影响。
干预性研究为了保证随机分组组间的可比性,我们必须对基线进行均衡性验证。表1可以作为研究对象资料描述,无需比较!
表2和表3是对临床指标和实验室指标进行两组差异性分析。注意采用的t检验也是单因素分析,结果可见6项实验室指标,3项临床指标有统计学意义,P<0.05。
表4是采用Logisitc回归进行的单因素分析,放入的指标依旧是表2和表3筛选出有意义的9个指标。但是有意义的是6个指标,有3个指标无意义。
松哥统计说:对于风险因素发现模型,我们常采用先单后多(先单因素分析、后采用多因素分析)的方式,发现最终的独立的风险因素。
单因素分析有两种:对于Logistic回归模型,一种是卡方检验和t检验;另一种是指单因素Logistic。两种结果理论上应该是一致的,因此统计分析可以二选一。
而本文作者差异性检验单因素分析做了,单因素Logistic回归也做了,有点重复操作,另外两者结果理论上是一致的,但是此处有3个指标不同。也许统计上有这种可能,但是有点让人困惑。
表5:是对单因素Logistic回归筛选的6项有意义的指标,进行的多因素分析,6项指标均有意义。此处统计分析方法没问题,但是
本例样本量90例,很多人认为纳入模型6个因素,按照1:10的样本量比例,本例样本量90例,足够构建模型。
但是Logitic回归样本量要遵循10EPV原则,就是每个变量要针对10个Events,本例只有24人发生死亡,多因素分析只能纳入2-3个自变量。
---统计思维与理论系列---
【1113.】医学论文中常用回归分析方法的审核要点[松哥荐读]及对策
【1105.】统计问诊:松哥为什么我回归模型无法计算可信区间
[1103.]CNKI升级了,即使撤稿也还能下载,如此留下痕迹,侥幸者要注意啦!
【1090.】中英文期刊分类(SCI分区和中文核心),一文秒懂!
【1086.】为啥20分以上SCI论文如此钟情P-interaction!
【1084.】哎呦妈呀!几何均数还有标准差呀?书中从来没说过呀!
【1075.】很有意思的一个统计问题,并发症到底该如何分析?
【1072.】单因素Logistic回归变量筛选,你还在用表表达,看看人家如何可视化的,审稿人看了能不开心吗?
【1070.】性别和吸烟是专业公认的危险因素,为啥多因素分析性别没意义了?
【1061.】这篇SCI的诊断试验结果看不懂,他到底是咋比的
【1055.】单因素是危险因素,多因素却保护因素了,想逆天吗?
【1054.】这种文章统计套路您一定要学,不管你什么专业通杀
【1052.】同一肝癌患者,同时接受CT、超声和磁共振,如何分析?
【1050.】知道两组数据的样本量均数标准差,怎么算合并统计量呢?
【1049.】meta分析软件Revman5.3卡死解决方案
【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?
【1044.】松哥为啥我318样本量统计分析出来确实400样本量?
【1038.】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您
【1036.】Logistic回归文章的SCI审稿人意见解读
【1034.】正态分布的3个基因密码,聆听大自然心跳的代码!
【1033.】生存分析K-M法与COX回归结论不一致怎么办?
【1031.】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法
【1022.】听完四个小故事,你就明白主成分分析是啥意思了!
【1021.】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?
【1017.】倾向性评分后数据,应该采用配对设计还是成组设计?
【1009】P<0.05也别理直气壮,统计也会犯错,还分犯I类和II类错误?
【1008】文章鉴析:这篇文章或许有10处不适!
【1007】R×C卡方的Fisher确切概率法为什么会有卡方值
【1002】连续变量变成等级变量后,原来有意义的变量变得没意义了?
【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢
------------------------------