回归分析时,一定要单因素回归P<0.05的自变量纳入多因素回归吗? 2024-07-31 16:07:30 回归分析是医学研究最重要的手段,其中目的是探讨多因素情况下,各个因素的独立效应。那么,困惑诸多分析者的问题是,无论是医院的电子病历、还是调查研究,均涉及到几十个甚至上百个研究因素(我们称之为自变量),如何筛选构建一个多因素回归模型呢?也就是说,多因素回归时,到底哪些变量作为自变量呢?筛选自变量,最简单的方式、也最常见的方式是“先单因素后多因素法”,即先开展单因素回归,筛选出P值较小者一起纳入多因素回归模型。这种方法,郑老师上课也推荐给非统计学专业的医学生,不是说它是最好的方法,而是它最简单粗暴、最容易上手。我今天要回答一个问题是,单因素分析后,P值小于多少,才被纳入回归模型?是P<0.05吗?一、研究案例这是一项关于胰腺癌病人生存时间的研究。该研究的终点为死亡,此外结局指标还包括生存时间。跟结局有关的研究变量较多,本文分析主要目的是探讨影响因素,也就是影响胰腺癌病人生存时间的因素有哪一些?二、先单因素、再多因素的统计方法中国研究者最常见的回归方法就是先单因素、再多因素第一步,对上述变量均分别采用单因素回归方法。结果如下表2,性别、胰胆管浸润程度、占位数均无统计学差异,手术年龄、术中化疗、有无腹膜转移和TNM分期有统计学差异(P<0.05)第二步,挑选P值较小者,纳入多因素回归模型。本案例挑选P值较小者(P<0.05)的变量:手术年龄、术中化疗、有无腹膜转移和TNM分期,将其纳入回归模型中。第三步,采用向前逐步回归法(Forward),开展多因素分析。结果见表3。最终构建的模型中包括了手术年龄、术中放疗和TNM分期,且各因素与生存时间之间均有统计学意义(P<0.05)。三、为什么要先单后多比如,现在研究要评价结胰腺癌患者生存的影响因素(后期来构建预测模型),与患者有关的因素包括患者的基本情况、患者病情、患者入院治疗、用药的各种特征、出院后行为、饮食、以及就诊特征,可能各因素都会影响生存结局。研究影响生存结局的因素可以构建多因素COX回归模型。构建COX回归模型时,是要同时把所有自变量(也就是原因变量)纳入回归方程吗?当然不能,理由如下:(1)这些因素作为自变量放在一起,各个变量的复杂的关系,比如共线性问题,比如存在着中间变量,可能会导致模型构建失败。(2)任何一个回归模型,往往基于有限样本量构建。样本量和纳入模型自变量数量息息相关,太多变量而样本量不足时,同样模型构建失败。因此,回归分析一般对样本量有要求。(3)回归分析探讨影响因素,后期是为了构建预测模型,自变量个数也不能太多。为什么,预测模型是为了后期预测患者结局,需要采集模型所有的自变量的指标值,测定指标需要成本,自变量个数越多,则预测成本越高。因此,必须筛选为数不多、合适的变量进入回归模型。总的来说,我用一个形容词来说回归模型构建的理念:“大道至简”。模型不要太复杂!在具体的处理上,我认为可以采用"严进严纳" 的理念进行自变量筛选。严进严纳的方法基本理念是,即在纳入自变量的时候需要严格纳入,在排除自变量的时候,没有多大意义的别在最终模型中来。四、P<0.05才被纳入模型吗?大家从第三点可以理解原因:主要就是怕自变量太多而又关系太复杂,样本量不够多,模型构建失败。一个线性回归模型,需要5-10以上的样本量;logistic需要10-15倍的样本量。那么有限的样本量,你不能一下子把所有的感兴趣的变量全部放进去,那样肯定无法成功形成回归模型,造成多因素好回归所有的P值都>0.05。所以才去的措施是:严纳!挑选少量的自变量进入模型。严纳的方式很多,对于初学者,简单粗暴而且被认可的方法就是把单因素分析P值较小者纳入到回归模型中来。所以,一定要P值小于0.05才纳入进来吗?不是的!(1)很多变量虽然单因素回归分析P>0.05,也有可能多因素回归P<0.05。所以,不能就卡在0.05的界限。个中原因我就不多说了!(2)如果你的自变量非常重要,特别是核心变量,哪怕单因素分析P较大,也值得多因素回归放进去分析(3)很多时候自变量个数也就是3~5个,而样本量较大,这个时候根本不怕自变量太多,没有必要先单因素后多因素。因此,我把情况分为以下几种,仅供参考:第一种:全部纳入这种方法要求自变量较少,自变量之间关系简单,多重共线性不严重。一般情况下,自变量个数不太多(比如少于10个),且样本量是自变量个数20倍以上,可以采用本方法。第二种方法:单因素筛选纳入(P值较小者,P<0.2或者<0.1)这种方法要求自变量不是那么多,但样本量也不是那么大,因此可以考虑先单因素后多因素回归的方法。P值不要过于严格,一般P<0.2就可以了!第三种方法:单因素筛选纳入(P值较小者,P<0.05)这种方法出现在自变量非常多几十个上百个,单因素分析P<0.05者超过10个以上(P<0.2的自变量更多了)。这种情况下,严格控制多因素回归自变量个数。P<0.05者纳入多因素回归分析中。五、特别注意1.上述的方法是本人统计分析习惯,没有特别的指导文献,请谨慎采纳。2.“先单后多”的回归方法是初学者模式,若您要发表高水平文章,有更多的选择。详情可见下面的系列文章,会让你大开眼界!12篇文章,手把手教你如何科学地构建回归模型!3. “先单后多”的单因素分析,并不是一定要单因素线性回归或者单因素logistic回归,单因素线性回归可以用t检验或者F检验代替;单因素logistic回归可以用卡方检验代替。详细可见下面链接学习:两组均数比较,可以用方差分析吗?谈谈结果一样的那些统计方法。4.本篇文章是本人回归原则“严进严纳”的上篇,下篇我将介绍严纳:要不要使用逐步回归法! 赞 (0) 相关推荐 预测模型第7期 | 临床预测模型中的变量筛选方法 SPSS变量筛选方法 在SPSS中的Logistic回归和Cox回归分析时,软件一般给出了7种变量筛选的方法: 条件参数估计似然比检验(向前:条件); 最大偏似然估计的似然比检验(向前:LR); Wa ... 观察性研究中的logistic回归分析思路 本文内容来自<中华流行病学杂志>2019年第40卷第8期,作者为冯国双教授,原题目为<观察性研究中的logistic回归分析思路>.将这篇文章分享给医咖会的伙伴们,希望大家能从 ... SAS系列37:Logistic回归模型与SAS实现(二) 导读 上一期介绍了非条件Logistic回归的SAS实现,今天介绍条件Logistic回归的SAS实现. 三.Logistic回归模型的SAS实现 (一)Logistic回归模型的SAS语句 ... 回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好? SPSS教程44 单.多因素回归结果结果矛盾的处理方法 这一篇接着介绍先单后多的统计建模方法. 先单后多,最令人沮丧的,莫过于单因素P<0.05,而多因素大多数没有统计学意义,甚至一个都没有.这 ... 集合竞价时主力大单封板,9:20分撤单说明什么?不懂难怪血本无归 真正要在市场混下去,说复杂也复杂,说简单也简单,因为你只要抓住下面几点,坚持不懈,不赢都难: 第一,中线始终看周线和日线,别看日以下的周期,短线只看日线和分钟线,30分钟级别以下的别看; 第二,只用均 ... 2021年3月14日上午10时召开古单朱氏忠孝堂理事会第三届六次会议。 古单朱氏忠孝堂 古单朱氏忠孝堂理事会 今天 古单朱氏<忠孝堂> 2021年3月14日上午10时召开古单朱氏忠孝堂理事会第三届六次会议. 会长朱经虎,常务副会长朱叶,副会长朱经诂,秘书长朱国 ... python测试开发django-102.验证时form表单error_messages 前言 form表单验证前端输入内容是否合法时,可以定义error_messages参数,用于前端页面展示错误信息 error_messages参数 LoginForm 表单添加 常用的error_me ... 快乐8第2021196期单区间一二三四五大作战,1区低于均值未来回归 如果去观察走势图,就会发现每期总有些号码会集中到某块区域,如果能提前预判到可能出现的号码集中区域,提前入场,命中率就能有效提高了.就像你知道哪里有鱼,就去那里钓鱼,成功概率比较大一样. 把快乐8全部8 ... 对话瓦里安|坚定质子路线,选择单室或多室质子治疗系统需要考虑这些因素 英国当地时间2019年6月12日,质子中国在第58届PTCOG年会期间有幸专访了瓦里安质子治疗解决方案全球总裁兼首席增长官Kolleen Kennedy女士 Kolleen Kennedy女士 我们 ... 开学时的推荐书单,写给大学生、研究生、中小学生家长 后台有好几个读者留言,马上要开学了,有什么推荐书单吗? 以前写过不少自我成长方面的书单,今天换个角度,针对:大学生.研究生和中小学生家长,都推荐几本. 好处不止这些书,但我要推荐太多的书,可能完全没人 ... 4本连刷百遍后依旧爱不释手的精彩玄幻小说,书荒时的必备书单! 今天小编要为大家推荐4本连刷百遍后,依旧爱不释手的精彩玄幻小说,尤其是喜欢玄幻小说的书迷们,可千万不要错过呀,相信你们看后一定会对这4本小说欣喜不已,就连老书虫也是百看不厌,绝对是书荒必备书单! &l ... 单飞不成又归队,十周岁的启辰回归东风日产 翅膀硬了要单飞,翅膀断了只能回头. 文/宋双辉 就在2020年还有四天结束的时候,东风集团发布公告,对东风与日产在华合资公司东风有限进行整合,原有7个事业部合并为5个,东风启辰回归到东风日产旗下,结束 ...