12篇文章,手把手教你如何科学地构建回归模型! 2024-04-22 11:44:09 作为医学统计学与SPSS教程的重要组成部分,系列教程《如何科学地构建回归模型》完结。它们分别是:1.一道饕餮大餐来了!手把手教你如何科学地构建回归模型!2.一文汇总三大回归的基本应用条件、诊断与处理方法3.回归分析时何时设置哑变量?如何设置?4.当回归分析模型遇到连续型自变量,我该怎么办?5.吃巧克力预防高血压?一文学会P trend计算,掌握趋势性分析6.你只会“先单后多”吗?如何筛选自变量建立多因素回归模型7.你认识它吗?--有向无环图(DAG):回归分析中自变量筛选的指导思想8.中介变量一直很重要,一直被忽视!如何在回归分析中考虑中介变量?9.控制混杂偏倚的回归自变量筛选法,强烈推荐Change-in-Estimate法10.回归分析筛选自变量,不推荐逐步回归法?那我应该怎么办?11.回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?12.一个困扰已久的问题:回归分析样本量如何确定?应该说,这一系列不够完整,感觉还差一两篇。不过对于大多数人来说,足够学习了。这一系列大致完整地告诉诸位,如何避免简单粗暴地开展回归分析,而根据一定的条件与场合去建立回归模型。现在,我帮助大家来梳理一下,方便有兴趣者学习建立回归分析的第一个要考虑的是,回归分析的条件。对此,我首先和大家讲述线性回归、logistic回归、Cox回归的条件。一文汇总三大回归的基本应用条件、诊断与处理方法在应用条件中,回归分析两类自变量需要值得大家关注。第一种,当变量是无序分类变量时,大家需要考虑哑变量的设置问题:回归分析时何时设置哑变量?如何设置?第二种情况,当变量是定量变量时,考虑的策略很多,既可以考虑哑变量设置、也可以进行趋势性检验分析,或者什么都不考虑,直接纳入自变量进入模型。当回归分析模型遇到连续型自变量,我该怎么办?吃巧克力预防高血压?一文学会P trend计算,掌握趋势性分析如何挑选自变量进入模型呢?接下来,如何纳入自变量进入模型呢?一般来说,回归模型的自变量不能太多。这主要由于自变量太多而模型样本量不大时,模型可能无法成功建立起来。因此回归分析一方面对样本量有要求:一个困扰已久的问题:回归分析样本量如何确定?另一方面,限制自变量进入模型。如何限制?基本原则是“大道至简”、“严进严纳”,即要求纳入模型的自变量,不用太多,留在模型的自变量也应该控制在一定水平内。下面这篇文章进行了总的介绍:你只会“先单后多”吗?如何筛选自变量建立多因素回归模型在自变量控制与筛选中,可以采用DAG、先单后多、效应改变法、逐步回归法、多模型法帮助我们完成这一任务。回归分析包括研究影响因素、控制混杂、预测与分类三大目的。不同的回归分析目的有不同的回归筛选方法。本系列文章就前两者的回归策略我做了介绍,这里做一个梳理与总结。如何研究影响因素?所谓“研究影响因素”,一般为探索性的研究。面对健康问题,我们掘地三尺,希望能够从我已经拿到的变量中,找到与影响健康问题发生、发展、转归的因素。这些因素五花八门,包括个体特征、生活方式、生活环境、临床诊疗、心理特征等。这些因素,又是分层次的,存在着远因与近因,远因对健康结局有影响,而且可能通过近因而发挥作用,因此,近因又可能是中介变量。因此,研究影响因素为目的的回归,中介变量是需要考虑的问题。考虑中介变量的方式,就是建立因果关系链,即DAG理论:你认识它吗?--有向无环图(DAG):回归分析中自变量筛选的指导思想中介变量一直很重要,一直被忽视!如何在回归分析中考虑中介变量?因此,研究影响因素路径,第一步工作是,建立DAG图谱,大致建立各自变量与结局、各自变量与各自变量直接的因果关系。研究影响因素路径,第二步工作是,挑选合适的变量进入模型。方式有三种,第一种,排除中介变量,直接挑选理论上与研究结局因果关系明确的自变量进入模型。第二种,先单后多方法。先单因素分析,然后再排除中介变量,挑选单因素回归分析P值较小者纳入模型,开展多因素回归分析。第三种,多模型法分析:至少建立2个模型,有中介变量的模型和没有中介变量的模型开展回归分析。这样的做法既可以排除中介变量看远因,也可以分析中介变量(即近因)的影响。研究影响因素路径第三步工作是,考虑在多因素回归过程中,剔除多余的自变量。这一步不是必选项,一般情况下,在样本量足够大且自变量个数不多时,不考虑。当然,如果模型纳入模型自变量实在仍然很多,可以采用逐步回归法进行分析,而一般情况下,不推荐逐步回归法。回归分析筛选自变量,不推荐逐步回归法?那我应该怎么办?如何控制混杂偏倚呢?控制混杂偏倚的目的其实也是探讨影响因素,只不过在该目的中,我们不再将爱泛化,而是钟情于1、2个自变量,其它变量可能是混杂偏倚,需要通过模型进行控制的。控制混杂偏倚路径,第一步工作是同样是建立DAG理论,大致地分析,哪些是混杂变量,哪些可能又是中介变量。中介变量虽然不是混杂变量,但仍然是我们需要重点考虑的。控制混杂偏倚路径,第二步工作是,纳入自变量进入模型,大致地方法也有以下几种,第一,如果自变量不多,在排除中介变量后,直接纳入所有自变量与目标变量进入回归分析模型;第二,在排除中介变量后,采用效应改变方法开展回归分析控制混杂偏倚的回归自变量筛选法,强烈推荐Change-in-Estimate法第三,先单后多方法。先单因素分析,挑选潜在混杂变量。这个单因素分析,一般可以通过与目标自变量的关联性分析,或者与结局变量的关联性分析,考虑是否是可疑的混杂因素(当P<0.05是为潜在混杂因素)(写医学研究SCI文章,不能不了解混杂因素与混杂偏倚!);挑出P<0.05者,在排除中介变量后,连同目标变量,纳入多因素回归分析模型。第四种方法,如果自变量太多,可以考虑先单后多与效应改变法的结合。控制混杂偏倚路径,第三步工作是多因素回归分析后,排除多余自变量。这一步,可以省略,因为控制混杂偏倚一般不建立采用逐步回归方法进行分析。如果纳入多因素回归的自变量个数有点多,构建模型很吃力!建立采用倾向得分方法进行分析。最后,无论是研究影响因素,还是控制混杂,都会存在令人困惑地方,即单因素回归分析P<0.05,而多因素回归P>0.05,不再具有统计学意义。这个时候,郑老师也提供了相应的策略帮助大家理解结果:回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?总结回归模型不能在简单粗暴、一下子将自变量直接全部纳入多因素回归分析,或者直接先单因素后多因素了!这只会“garbage in、garbage out”。努力建立一个有灵魂的回归模型吧!整个系列,我也有很多内容没有叙述,比如对于自变量 与应变量非线性关系,如何建立非线性回归呢?对于自变量或者应变量出现异常值时,如何处理呢?对于控制混杂偏倚,倾向得分法其实可以讲讲的。上述这些内容,我将择时,再专门进行介绍,到时候欢迎学习。对于上述清单?你有何感想?如果有有更好的内容建议,请留言!支持郑老师,快来点击“分享”吧 赞 (0) 相关推荐 实证研究中常常忽视的一个点:该如何将“控制变量”的选择进行到底 图片来源:网络 人的行为惯性,往往会主导我们的思路!在实证分析中,我们常常重视因变量和自变量的选取和定义,而忽视控制变量的选取的重要性.但是,我们不能轻视的是,控制变量也是实证研究中重要的一环,能否选 ... 如何解读链式中介作用分析结果? 中介作用是研究自变量X对因变量Y的影响时,是否会先通过中介变量M,再去影响Y.比如工作满意度(X)会影响到创新氛围(M),再影响最终工作绩效(Y). 在中介作用研究中,如果自变量与因变量之间存在多个中 ... 中介效应是个什么作用? 中介变量(mediator)是自变量X对因变量Y产生影响的中介,如果变量X通过影响变量M来影响因变量Y则称M为中介变量,也就是说自变量X对因变量Y的影响有一部分或者全部是通过中介变量M来发挥作用的.通 ... 多因素回归探讨影响因素,推荐 “逐步回归法” 吗? 答案是: 不太推荐! 很多人在多因素回归时候,喜欢用逐步回归法挑选自变量.我今天要来纠正下,不要觉得这种方法值得使用! 这篇推文,是初学者构建回归模型的下篇.在上一篇推文中,我介绍了,初学者可以先单后 ... 互助问答第528期:关于中介变量的问题 关于中介变量的问题 老师好,请问在做中介的时候需不需要在报告基准模型中加入中介变量.比如有3个中介分开来做为啥会出现两个部分中介和一个完全中介的情况?但是如果我把三个中介变量一起放到基准模型中,自变量 ... JAMA子刊:每日步行7千-1万步最能预防早死? 这个有意思结果如何被证明? 行走是一项常见的运动方式.近期,来自马萨诸塞大学的领导团队就通过长期的随访研究证实了每天运动步数和全因死亡率的关系.这篇题为<Steps per Day and All-Cause Mortal ... 合集 | 12篇文章,教你穿透财报看风险 声明 本报告由中债资信评估有限责任公司(China Bond Rating Co.,Ltd)(简称"中债资信",CBR)提供,本报告中所提供的信息,均由中债资信相关研究人员根据公开 ... 如何讲好中医理论?这篇文章手把手教你讲中医 经过这次疫情,中国让世界看到了 中医清调补,配合西医精密仪器 中西结合才是更加科学的治疗方式 抗疫利器清肺排毒汤 那么,如何讲好中医理论? 这篇文章手把手教你如何讲中医 并且通过中医望闻问切的&quo ... 结肠镜病理报告结果怎么看?这篇文章手把手教你 干货满满- 肠镜是诊断肠道疾病最准确.可靠的方法.肠镜检查是将一条长约1.3米.可弯曲.末端装有自带光源电子摄像装置的软管,由肛门慢慢插入大肠进行检查.若有需要,可获取活体组织进行病理学检验.在肠 ... 新来的化验员不会平板划线怎么办?这篇文章手把手教你! 食品实验室服务 如果你在实验过程中有什么好的经验与想法,给小编妹妹留言,我们一起探讨,共同进步! 一篇文章,教你如何快速掌握色彩冷暖色调的画法,取得高分 联考方向的色彩比较好理解 需要注意一些最基本的 包括构图.冷暖.块面等 当然 你想拿高分必须要有突破? 千万不要小看联考 首先我们在面对联考这样大型考试的时候,千万不能掉以轻心,有一些同学可能想着我就 ... 一篇文章,教你如何看舌象 泌尿男科王大夫2021-04-21 18:57:00 大家也都知道,中医讲究"望闻问切".观察一个人的舌象,就能从中看出很多问题.有句古话说得好"脉有假脉,舌无假舌&qu ... 4 篇文章,教你买对意外险! 意外险价格便宜,杠杆很高,几百块就能买到上百万保额. 但市场上的产品众多,很多人并不知道要怎么买. 今天,深蓝君整理了 4 篇相关文章,帮你 了解意外险的全部,选到合适的产品. 1 基础知识篇 ... 【砼学汇-操作篇】手把手教你调节臂架多路阀和臂架变量泵 应用类型 三一重工混凝土泵车臂架液压系统,液压泵采用力士乐公司的变量泵A7VO55.定量泵A2F032,或哈威公司的变量泵V60N-090.定量泵 SCO34.多路阀均采用哈威公司的PSL.PSV 型 ... 他入驻简书半个月,写了12篇文章,有五篇上了简书<首页推荐>,他到底写了什么? >>>瘸腿猫 --小男孩点点的成长档案库 ♥ 老应,是谁?老应是<瘸腿猫>微信平台那个写童话故事连载小应的老爸. 老 ...