R数据分析:如何绘制回归分析结果的森林图
今天给大家写写如何把你做的模型系数画出来,就是你的模型中自变量都有一个系数和置信区间嘛,那么我们把系数和其置信区间画出来的样子就像是meta中的森林图差不多,所以我把文章起了个绘制回归分析结果的森林图。
有人要问画这个有啥用呢?
你发SCI总能用得到的,虽然中文文章画这个的我没太见着,英文文章很多使用这种森林图展示结果的,下图就是一个例子,所以赶紧收藏一下哦。
实例描述
今天给大家画一个逻辑回归的。
今天的例子为研究GRE,GPA和学校排名是否会影响一个人被录取为研究生,在这个例子中GRE和GPA都是连续变量,学校排名rank为分类变量,是否录取admit为(0/1)二分类。
读入数据拟合模型一气呵成:
mydata <- read.csv('C:/Users/hrd/Desktop/bootcamp/dataset/binary.csv')
mylogit <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")
然后我们可以看一看模型的OR值和置信区间:
exp(cbind(OR = coef(mylogit), confint(mylogit)))
那么要画出模型系数的森林图最简单的就是直接把整个模型喂给plot_model这个函数:
plot_model(mylogit)
注意,我们图中间有个线比较白,这个叫做零作用线,在逻辑回归或者其他的广义线性回归中为1,在一般的线性回归中为o,那么我们可以改变这个线的颜色以示强调:
plot_model(mylogit, vline.color = "red")
当然,我们还可以改变量的排序,比如我想要效应大的自变量首先展示:
plot_model(mylogit, sort.est = TRUE,vline.color = 'blue')
当然了,我们还可以自定义自变量的排序,你只需要把顺序喂给order.items参数就行:
plot_model(mylogit, order.terms = c(3,4, 5, 1, 2))
还有一个比较有用的技巧就是,你可以在图中展示自变量效应的大小和p值:
plot_model(mylogit,show.values = T)
很多情况下你还想改变图的默认标题,也很好办,比如我可以改成我想要的标题:
plot_model(mylogit,show.values = T,title ='关注Codewar,数据处理不迷路,哈哈哈')
这种森林图还有很多技巧,以后给大家一一介绍。