手把手教你做非条件Logistic回归

Logistic回归分析常常用于流行病学的病因研究,分析疾病与危险因素间的相关性。非条件Logistic回归适用于队列研究、病例对照研究以及现况调查的病因学研究。下面,我们进行具体的操作。

01

数据的准备

数据准备是最重要的一步,数据格式不会准备,下面什么也不用做了,有些公众号或者博客介绍R操作时候经常用R自带的数据,这样还不如写,因为有很多人不知怎么样准备自己的数据。我们的数据格式如下:

patient_id代表病人的id,smoking_year代表吸烟年龄,stastus代表生存状态,0:存活,1:死亡,这里我们是探讨吸烟年龄与死亡的关联性,这里采用非条件Logisti回归,大家改为自己的数据即可,将数据保存为.txt格式,命名为mydata.txt

02

代码操作

#1_设定自己的工作目录

setwd("C:\\Desktop\\logistic")

#2_读取数据

data<-read.table("mydata.txt",header=T,sep = "\t")

#3_logistic回归

lg<-glm(status~smoking_year,family = binomial(),data = data)

#其中status为y, smoking_year为x

#4_展示结果

summary(lg)

03

结果

Call:

glm(formula = status ~ smoking_year, family = binomial(), data = data)

Deviance Residuals:

Min        1Q    Median        3Q       Max

-2.45144   0.00254   0.00254   0.31881   2.01538

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept)   -6.7344     1.1219  -6.003 1.94e-09 ***

smoking_year   4.8442     0.7569   6.400 1.55e-10 ***

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 192.043  on 208  degrees of freedom

Residual deviance:  53.442  on 207  degrees of freedom

AIC: 57.442

Number of Fisher Scoring iterations: 8

(Intercept) smoking_year

-6.734393     4.844178

OR为4.844178,P=1.55e-10,说明吸烟年龄增加1年,死亡风险会增加约3,8倍。

本次分享就到这里,希望本文对大家有所帮助。

热门推荐

如何画出漂亮的箱线图呢?

临床预测模型快速入门课程

临床预测模型高分文献分享

GEO联合Oncomine数据挖掘

做了这么久meta分析和GEO数据挖掘,还不知道这里有一个接收率100%的期刊吗?

研究生应该靠什么来争夺奖学金呢?

扫一扫

关注我们

(0)

相关推荐