PLS回归分析具体示例与步骤
PLS回归(Partial Least Squares Regression)是一种结合了主成分分析、典型相关和多元线性回归的统计方法,适用于多自变量和多因变量的分析场景。以下是具体的示例和步骤说明。
示例背景
假设我们研究3个自变量(X1, X2, X3)对3个因变量(Y1, Y2, Y3)的影响关系。
具体步骤
- 确认主成分数量
- 交叉有效性分析:通过交叉有效性分析,确定主成分数量。交叉有效性指标越小,说明模型预测能力越强。
- 投影重要性VIP分析:VIP值反映了自变量对因变量的解释力度。如果增加主成分数量,VIP值没有明显增加,则说明已经找到最佳主成分数量。
- RMSEP值变化:RMSEP(Root Mean Square Error of Prediction)值越小,说明模型预测误差越小。观察RMSEP值的变化,选择变化不明显的主成分数量。
- 设置主成分数量后进行分析
- 描述主成分与研究项之间的关系表达式:通过主成分分析,得到主成分与研究项之间的关系表达式。
- 描述主成分与研究项之间的相关系数Loading值:Loading值展示了主成分与自变量或因变量之间的相关关系。
- 描述主成分与研究项之间信息解释率(方差解释率):方差解释率反映了主成分对原始变量信息的解释程度。
- 研究X对于Y的影响关系情况:通过回归系数检验,分析自变量对因变量的显著性影响。
- 研究X对于Y的解释力度:通过VIP值,分析自变量对因变量的解释力度。
操作步骤(以SPSSAU为例)
- 数据准备
- 在SPSSAU中导入数据,确保自变量和因变量均为定量数据。
- 开始PLS回归分析
- 在SPSSAU中选择“PLS回归”分析模块。
- 将自变量(X1, X2, X3)和因变量(Y1, Y2, Y3)分别拖入对应的分析框中。
- 确认主成分数量
- 在“主成分数量”选项中,选择“默认”或手动输入主成分数量。
- SPSSAU会自动生成主成分数量,并输出交叉有效性、VIP值和RMSEP值等指标。
- 设置主成分数量并进行分析
- 根据上述指标,确认主成分数量后,选择相应数量进行最终分析。
- SPSSAU会输出主成分与研究项之间的关系表达式、Loading值、方差解释率、回归系数检验结果和VIP值等。
结果解读
- 回归系数检验:查看p值,如果p值小于0.05,说明自变量对因变量有显著影响。同时,查看回归系数的正负向,判断影响方向。
- VIP值:VIP值大于1的自变量对因变量有较强的解释力度。
- 方差解释率:方差解释率越高,说明主成分对原始变量信息的解释程度越高。