偏最小二乘法路径模型分析plspm
PLS-PM是一种用于研究多个观测变量的数据分析方法,其中多个观测变量可以汇总为一个潜在变量,并且潜在变量之间存在线性关系。它将主成分分析、典型相关分析和多元回归结合起来迭代估计,是一种因果建模的方法。该方法对不同潜变量的观测变量子集抽取主成分,放在模型系统中,然后调整主成分权重,以最大化模型的预测能力。
完整的路径模型由两个子模型组成:inner model/structural model和measurement model/ outer model。Inner model是模型中与潜在变量之间的关系有关的部分。outer model是模型中每个潜在变量及其指标块(观测变量)之间的关系。
概念解释:
潜在变量:我们无法直接测量/观察的变量,通过测量观测变量得以对潜在变量的观察。
潜在变量:如物理因子、营养盐等
观测变量:如温度,溶氧,pH、磷酸盐、铵盐等
运行plspm分析
PLSPM分析我们至少需要准备(1)数据集;(2)inner model;(3)outer model。已经准备好数据集的情况下,接下来就是指定inner model和outer model。
1. 数据集的准备:
(1)下载和载入plspm包
(2)读取数据,这里我们用《PLS Path Modeling with R》第四章Interpreting PLS-PM Results 的数据举例。
2.构建path 矩阵,关键是确定latent variables之间的关系
矩阵定义方法:路径矩阵必须是方矩阵(行和列的数目相同),对角线及其上方的元素必须为零,对角线以下的元素可以为0或1。
小编的习惯是在写R matrix之前先列一个棋盘式矩阵,列好不同潜在变量之间的关系(有指向关系为1,没有指向关系为0)。具体如下:
整个矩阵表达的意思是:A对B,C,D,E产生影响;B对C,D,E产生影响;C对D,E产生影响;D对E产生影响,即列影响着行。
#以spainfoot数据在R中列出路径模型矩阵的行,包含3个向量
#以3个潜在变量组合创建path 矩阵
#给矩阵添加列名
foot_path #输入foot_path,我们即可在R控制台中查看path matrix
innerplot(foot_path) #查看inner model
3.定义 outer model(设定潜在变量所包含的观测变量数据)
这里来解释一下 reflective mode和formative mode
reflective model :X11,X12,X13为结果
formativemode : X21,X22,X23为原因
一个模型中可以同时拥有reflective mode和formative mode。
我们获得的pls是"plspm"类的对象。每次键入此类的对象时,都会显示以下结果列表:
我们还可以利用summary(pls)
6.运行各参数结果的查看
7.作图
plot(pls) #默认情况下,只出inner model的图,线条上方数值即path coeffcients.
#图片中参数的修改
#对于outer model的结果,我们需要查看"loading"
8. 关于模型建模效果的评估指数
(1)loading
pls$outer_model结果中loading,loading值是潜在变量与其观测变量之间的相关性。大于0.7是acceptable的,且值需为正。
解决方案是对于loading小于0.7的变量进行删除后重新运行pls路径模型,直到所有loading均>0.7,loading为负时更改符号,加一列数据* -1。
以下是loading符号的修改:
添加两列NGCH和NGCA
#检查列名
得到新的数据后,我们需要再次运行plspm(),并且重新定义 outer model blocks
#重新运行 plspm
(2) R^2是确定内源性潜在变量的系数。pls$ inner_summary打印结果。值在[0.3,0.6]是可接受的,>0.6时结果较好。针对内生变量
(3) Redundancy:它反映了一组独立的潜在变量解释因变量变化的能力。高冗余意味着高预测能力。
(4) GOF: 可同时对inner model和outer model 进行度量。我们可认为GOF是整个模型的平均预测指数。GoF值为 0.78认为模型的预测能力是78%。GoF >0.7时效果是比较好的。
参考文献:
[1]Sanchez G. PLS PathModeling with R. http://www.gastonsanchez.com. Trowchez Editions, Berkeley 2013.
[2]Hongwu Y , Juan L , YunhuaX , et al. An Integrated Insight into the Relationship between Soil MicrobialCommunity and Tobacco Bacterial Wilt Disease[J]. Frontiers in Microbiology,2017, 8:2179.
[3]Liao H, Friman VP, GeisenS, et al. Horizontal gene transfer and shifts in linked bacterial communitycomposition are associated with maintenance of antibiotic resistance genesduring food waste composting. Sci Total Environ. 2019, 660:841-850.
END