机器学习复习：线性回归1

原创已于 2022-09-26 13:42:18 修改 · 344 阅读

0 ·

CC 4.0 BY-SA版权

于 2022-09-26 13:33:28 首次发布

本文介绍了如何使用简单线性回归模型预测数据趋势，包括模型的建立、参数计算及评估方法。

Simple Linear Regression （简单的线性回归）

Least-Squares Fit:

在这里，我们使用least-squares(LS) fit去得到这两个参数。
首先计算 Residual sum of squares(RSS):
$i=1n(yi−yˆi)2RSS(β{_0},β{_1})=\sum_{\ i=1}^n{(y_i- \^y_i)^2}$
为了进行下一步的计算，先声明一些需要计算的参数：

名称	公式
样本均值(Sample mean)	$\bar x=\frac1n\sum_{\ i=1}^n{x_i}\\ \bar y=\frac1n\sum_{\ i=1}^n{y_i}$
样本方差(Sample variance)	$i=1n(yi−yˉ)2S^2_x =\frac1n\sum_{\ i=1}^n{(x_i- \bar x)^2}\\S^2_y =\frac1n\sum_{\ i=1}^n{(y_i- \bar y)^2}$
样本标准差(Standard deviation)	$i=1n(yi−yˉ)2S_x = \sqrt {\frac1n\sum_{\ i=1}^n{(x_i- \bar x)^2}}\\S_y = \sqrt {\frac1n\sum_{\ i=1}^n{(y_i- \bar y)^2}}$
样本协方差(Sample covariance)	$i=1n(xi−xˉ)(yi−yˉ)S_{xy} = \frac1n\sum_{\ i=1}^n{(x_i- \bar x)(y_i- \bar y)}$
样本相关系数(Sample correlation coefficient)	$\rho_{xy}=\frac{S_{xy}}{S_xS_y} = \frac{\frac1n\sum_{\ i=1}^n{(x_i- \bar x)(y_i- \bar y)}}{\frac1n\sum_{\ i=1}^n{(x_i- \bar x)}·\frac1n\sum_{\ i=1}^n{(y_i- \bar y)}}$

现在我们开始计算β0和β1，因为RSS计算的是真实值和预测值之间的差的平方，所以理论上，RSS越小则模型越准。而RSS是一个关于β0和β1的二元二次方程，并且二次参数的系数为正数，所以理论上，偏导为0的点就是最小值点，那么开始暴力求导吧！
$i=1n(yi−β0−β1xi)(1)0=\frac{\partial RSS(β{_0},β{_1})}{\partial β{_0}} =\frac{d}{d β{_0}}\sum_{\ i=1}^n{(y_i-β{_0}-β{_1}x_i)^2}\\=-2\sum_{\ i=1}^n{(y_i-β{_0}-β{_1}x_i)} \tag{1}$
$i=1n(yi−β0−β1xi)xi(2)0=\frac{\partial RSS(β{_0},β{_1})}{\partial β{_1}} =\frac{d}{d β{_1}}\sum_{\ i=1}^n{(y_i-β{_0}-β{_1}x_i)^2}\\=-2\sum_{\ i=1}^n{(y_i-β{_0}-β{_1}x_i)x_i}\tag {2}$
结合上表公式可从(1) $\Longrightarrow0=\bar y-β{_0}-β{_1}\bar x\\ \Longrightarrowβ{_0}=\bar y-β{_1}\bar x \tag{3}$
推导(2)可得 $i=1nxi2(4)0=\frac1n\sum_{\ i=1}^n{x_iy_i- \bar xβ{_0}-y_i-β{_1} \frac1n\sum_{\ i=1}^nx^2_i}\tag{4}$
将(3)代入(4)中
$0=\frac1n\sum_{\ i=1}^nx_iy_i- \bar x \bar y-β{_1}( \frac1n\sum_{\ i=1}^nx^2_i-\bar x^2)\\ \Longrightarrow β{_1} =\frac{S_{xy}}{S_x^2}\tag{5}$
通过(3),(5)我们就可以得到β0，β1的最佳值。
其中
$i=1nxi2−xˉ2S_{xy}= \frac1n\sum_{\ i=1}^n{x_iy_i- \bar x \bar y}\\ S_x^2=\frac1n\sum_{\ i=1}^nx^2_i-\bar x^2$

模型评估(Model evaluation)

将得到的β0，β1代入RSS方程可得
$RSS(β0,β1)=n(1−ρxy2)Sy2RSS(β{_0},β{_1})=n(1-\rho_{xy}^2)S_y^2$
通常我们计算R2来评估模型的好坏
$R2=1−RSS/nSy2=ρxy2R^2=1-\frac{RSS/n}{S_y^2} =\rho_{xy}^2$
如果
R2=1，则这个模型很好，
R2=0，则表示这个模型的准确率和随机模型差不多
R2<0，则该模型还不如扔色子来的准