手把手教你做非条件Logistic回归
Logistic回归分析常常用于流行病学的病因研究,分析疾病与危险因素间的相关性。非条件Logistic回归适用于队列研究、病例对照研究以及现况调查的病因学研究。下面,我们进行具体的操作。
01
数据的准备
数据准备是最重要的一步,数据格式不会准备,下面什么也不用做了,有些公众号或者博客介绍R操作时候经常用R自带的数据,这样还不如写,因为有很多人不知怎么样准备自己的数据。我们的数据格式如下:
patient_id代表病人的id,smoking_year代表吸烟年龄,stastus代表生存状态,0:存活,1:死亡,这里我们是探讨吸烟年龄与死亡的关联性,这里采用非条件Logisti回归,大家改为自己的数据即可,将数据保存为.txt格式,命名为mydata.txt
02
代码操作
#1_设定自己的工作目录
setwd("C:\\Desktop\\logistic")
#2_读取数据
data<-read.table("mydata.txt",header=T,sep = "\t")
#3_logistic回归
lg<-glm(status~smoking_year,family = binomial(),data = data)
#其中status为y, smoking_year为x
#4_展示结果
summary(lg)
03
结果
Call:
glm(formula = status ~ smoking_year, family = binomial(), data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.45144 0.00254 0.00254 0.31881 2.01538
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.7344 1.1219 -6.003 1.94e-09 ***
smoking_year 4.8442 0.7569 6.400 1.55e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 192.043 on 208 degrees of freedom
Residual deviance: 53.442 on 207 degrees of freedom
AIC: 57.442
Number of Fisher Scoring iterations: 8
(Intercept) smoking_year
-6.734393 4.844178
OR为4.844178,P=1.55e-10,说明吸烟年龄增加1年,死亡风险会增加约3,8倍。
本次分享就到这里,希望本文对大家有所帮助。
热门推荐
扫一扫
关注我们