工程数据分析中的线性回归:从理论到MATLAB实践
1. 总和平方和(SST)与平方和计算
总和平方和(SST)用于衡量响应变量 $y$ 与均值之间的距离,其计算方式为每个观测值与 $y$ 的均值的偏差的平方和,公式为:
[SST = \sum_{i}(y_i - \bar{y})^2]
下面通过一个具体的例子来计算各种平方和:
| 预测值 $\hat{y}_i$ | 观测值 $y_i$ | $\hat{y}_i - \bar{y}$ | $(\hat{y}_i - \bar{y})^2$ | $y_i - \bar{y}$ | $(y_i - \bar{y})^2$ |
| — | — | — | — | — | — |
| 10.18141576 | 10.5 | 2.716416 | 7.378915 | 3.035 | 9.211225 |
| 9.943133676 | 9.8 | 2.478134 | 6.141147 | 2.335 | 5.452225 |
| … | … | … | … | … | … |
经过计算,得到:
- 回归平方和(SSR):$SSR = 58.89618$
- 残差平方和(RSS 或 SSE):$RSS = SSE = 4.089317$
- 总和平方和(SST):$SST = 62.9855$
2. 决定系数($R^2$)
决定系数 $R^2$ 用于确定模型的拟合优度,它表示简单线性回归模型能够解释的观测值 $y$ 的变化比例。$R^2$ 值越高,说明简单线性回归模型在解释 $y$ 的变化方面越成功。$R^2$ 有两种形式
超级会员免费看
订阅专栏 解锁全文
6676

被折叠的 条评论
为什么被折叠?



