机器学习-线性回归

最新推荐文章于 2024-11-15 21:47:57 发布

原创最新推荐文章于 2024-11-15 21:47:57 发布 · 248 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法

本文深入解析了线性回归的基本公式与代价函数的概念，通过梯度下降法寻找最佳参数θ0和θ1，以实现代价函数的最小化。介绍了梯度下降法的工作原理及其在参数更新过程中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文参考吴恩达机器学习课程第2章

线性回归公式:

$f(x)=θ0+θ1xf(x)=\theta_0 + \theta_1x$
代价公式(误差均值中的2用来抵消求导得来的2):
$J(θ0,θ1)=12m∑i=1m(fθ(x)i−yi)2J(\theta_0,\theta_1)=\frac{1}{2m}\sum_{i=1}^m(f_{\theta}(x)^i - y^i)^2$

目标：代价最小化

这里演示单变量线性回归时:
令 $θ0=0\theta_0=0$ , $f(x)=θ1xf(x)=\theta_1x$
可对 $J(θ1)J(\theta_1)$ 求导,
$J′(θ1)=1m∑i=1m(θ1xi−yi)J^{'}(\theta_1)=\frac{1}{m}\sum_{i=1}^m(\theta_1x^i - y^i)$
此时 $J′(θ1)=0J^{'}(\theta_1)=0$ 方可求出 $θ1\theta_1$

实际上，由于代价函数经常含有2个及以上参数，目前函数处于三维空间x, y, z分别为 $θ0,θ1,J(θ0,θ1)\theta_0,\theta_1,J(\theta_0,\theta_1)$ ，无法直接求导获得最佳参数组合
所以我们实际上，是不断尝试 $θ0,θ1\theta_0,\theta_1$ 不同的值，找到损失结果最小的那组 $(θ0,θ1)(\theta_0,\theta_1)$ 。
我们如何找到合适的尝试方法来找到这组参数呢,目前使用

梯度下降法

在这里插入图片描述
算法特点:从不同的起始值开始，获得的局部最优解是不一样
为了方便，设 $θ0=0,θ1=0\theta_0=0,\theta_1=0$
$α\alpha$ 为学习率(不变)， $ddθiJ(θi)\frac{d}{d\theta_i}J(\theta_i)$ 为偏导数，参数更新公式:
$θi:=θi−αddθiJ(θ0,θ1)\theta_i:= \theta_i - \alpha\frac{d}{d\theta_i}J(\theta_0,\theta_1)$ ( $i = 0, 1$ )

具体展开:
$θ0:=θ0−αddθ0J(θ0,θ1)=θ0−1m∑i=1m(θ0+θ1xi−yi)\theta_0:=\theta_0-\alpha\frac{d}{d\theta_0}J(\theta_0,\theta_1)=\theta_0-\frac{1}{m}\sum_{i=1}^m(\theta_0 + \theta_1x^i-y^i)$
$θ1:=θ1−αddθ1J(θ0,θ1)=θ0−1m∑i=1m(θ0+θ1xi−yi)∗xi\theta_1:=\theta_1-\alpha\frac{d}{d\theta_1}J(\theta_0,\theta_1)=\theta_0-\frac{1}{m}\sum_{i=1}^m(\theta_0 + \theta_1x^i-y^i)*x^i$

导数项: 达到局部最优解时(图中某一处局部最低点时)，此时导数项为0， $θi:=θi−α∗0\theta_i:= \theta_i - \alpha*0$ ，参数不再更新,且随着 $J(θ)J(\theta)$ 接近最低点，导数项也会越来越小，所以暂时学习率可不变。
梯度下降可以用于更新任何可微(因为需要求导)的代价函数J,目前使用的梯度下降用到了 $∑i=1m\sum_{i=1}{m}$ ，意味着每下降一次遍历一整个数据集，也称batch梯度下降算法。