线性模型:变量关系探索与预测模型构建
1. 变量关系的初步探索
在进行统计分析之前,我们可以通过绘制变量图表来判断它们之间是否存在联系。以营销投资和销售为例,预测的准确性依赖于这两个变量之间的紧密联系。而相关系数则能衡量这种联系的统计重要性。
1.1 相关系数的含义与计算
相关系数的取值范围在 -1 到 1 之间:
- (r = +1) 表示 (X) 和 (Y) 变量之间存在完美的线性关系。
- (r = -1) 表示完美的负线性关系。
- (r = 0) 表示不存在线性关系,此时斜率为零。
相关系数的计算公式为:(r_{xy}=\frac{协方差}{标准差的乘积}=\sqrt{r^2}) ,其中 (b_1) 的符号就是线性模型斜率的符号。
例如,已知 (b_1) 斜率 = +0.04,决定系数 (r^2 = 0.643),则相关系数 (r_{xy} = +\sqrt{0.643} \approx 0.8) 。这表明 (X) 预测变量和 (Y) 结果变量之间存在很强的关系,即增加电视营销投资时,销售会增加。
1.2 线性模型中斜率的类型
通过绘制销售((Y))和营销((X))之间的关系图,我们可以判断斜率的情况:
- 正斜率:表示变量之间存在直接关系,即 (X) 变量增加时,(Y) 变量也增加。
- 负斜率:表示变量之间存在反比关系,即 (X) 变量增加时,(Y) 变量减少。
- 斜率为零:表示变量之间不存在关系,此时 (X) 变量无法用于预测 (Y) 的值。
2. 斜率的统计显著性检验
为
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



