回归系数的重要性解读
1. 引言
普通回归模型是预测单个连续变量 Y 最常用的技术。对该模型的解读主要借助三个概念来聚焦于模型的系数,分别是统计 p 值、“保持不变”的变量以及标准化回归系数。这三个概念虽被广泛使用,但常被误解。下面将深入探讨这些概念,揭示统计 p 值在判定 Xi 是否为重要预测变量时存在的问题,强调“保持不变”的变量概念对可靠评估 Xi 如何影响 Y 预测的关键作用,以及标准化回归系数仅在特定情况下能对变量的预测重要性进行正确排序。
2. 普通回归模型
普通回归模型,正式名称为普通最小二乘法多元线性回归模型,是预测单个连续变量最流行的技术。其理论成熟,主要的统计计算机软件包中都有相应的估计算法。该模型相对容易构建,通常能产生可用的结果。
设 Y 为连续因变量(如销售额),X1、X2、X3、Xi、…、Xn 为预测变量。回归模型(预测方程)定义如下:
[Y = b_0 + b_1X_1 + b_2X_2 + … + b_iX_i + … + b_nX_n]
其中,b 为回归系数,通过普通最小二乘法进行估计。系数估计完成后,将个体的预测变量值代入方程,即可计算出该个体的预测 Y 值(估计销售额)。
3. 四个常见问题
对模型的解读围绕回归系数,借助统计 p 值、当其他 X 变量保持不变时 Xi 单位变化引起的 Y 平均变化以及标准化回归系数这三个概念。以下四个问题普遍适用于对回归系数的讨论:
1. Xi 对良好预测是否重要? 通常认为,如果 Xi 对应的 p 值小于 5%,则它是重要的预测变量。但这一答案在实验研究中正确,在
超级会员免费看
订阅专栏 解锁全文
1706

被折叠的 条评论
为什么被折叠?



