1. 线性回归模型
1.1 简单线性回归
y=β0+β1x+ϵ y = \beta_0 + \beta_1 x + \epsilon y=β0+β1x+ϵ
1.2 多元线性回归
y=β0+β1x1+β2x2+⋯+βpxp+ϵ y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_p x_p + \epsilon y=β0+β1x1+β2x2+⋯+βpxp+ϵ
2. 参数估计
2.1 最小二乘估计
β^=(XTX)−1XTy \hat{\beta} = (X^T X)^{-1} X^T y β^=(XTX)−1XTy
2.2 残差计算
ei=yi−y^i e_i = y_i - \hat{y}_i ei=yi−y^i
3. 模型评估
3.1 总平方和(SST)
SST=∑i=1n(yi−yˉ)2 SST = \sum_{i=1}^n (y_i - \bar{y})^2 SST=i=1∑n(yi−yˉ)2
3.2 回归平方和(SSR)
SSR=∑i=1n(y^i−yˉ)2 SSR = \sum_{i=1}^n (\hat{y}_i - \bar{y})^2 SSR=i=1∑n(y^i−yˉ)2
3.3 残差平方和(SSE)
SSE=∑i=1n(yi−y^i)2 SSE = \sum_{i=1}^n (y_i - \hat{y}_i)^2 SSE=i=1∑n(yi−y^i)2
3.4 决定系数(R²)
R2=SSRSST=1−SSESST R^2 = \frac{SSR}{SST} = 1 - \frac{SSE}{SST} R2=SSTSSR=1−SSTSSE
3.5 调整R²
Adj. R2=1−SSE/(n−p−1)SST/(n−1) \text{Adj. } R^2 = 1 - \frac{SSE/(n-p-1)}{SST/(n-1)} Adj. R2=1−SST/(n−1)SSE/(n−p−1)
4. 假设检验
4.1 t检验统计量
t=β^jSE(β^j) t = \frac{\hat{\beta}_j}{SE(\hat{\beta}_j)} t=SE(β^j)β^j
4.2 F检验统计量
F=SSR/pSSE/(n−p−1) F = \frac{SSR/p}{SSE/(n-p-1)} F=SSE/(n−p−1)SSR/p
5. 其他回归模型
5.1 逻辑回归
ln(p1−p)=β0+β1x1+⋯+βpxp \ln\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p ln(1−pp)=β0+β1x1+⋯+βpxp
5.2 泊松回归
ln(λ)=β0+β1x1+⋯+βpxp \ln(\lambda) = \beta_0 + \beta_1 x_1 + \cdots + \beta_p x_p ln(λ)=β0+β1x1+⋯+βpxp
符号说明
- yyy: 因变量
- xxx: 自变量
- β\betaβ: 回归系数
- ϵ\epsilonϵ: 随机误差项
- nnn: 样本量
- ppp: 自变量个数
- y^\hat{y}y^: 预测值
- yˉ\bar{y}yˉ: 因变量均值