理解Batch梯度下降算法-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_43631663/article/details/101308078

batch梯度下降算法

假设有训练数据
在这里插入图片描述
这是42个房屋的数据，包括房子大小以及房屋价格
我们的假设满足数据的函数是这样的线性函数Hypothesis: $h\theta(x)=\theta0+\theta1x$
$\theta i:模型参数$
$\theta取不同的值有不同的模型$

我们因该选取最佳的 $\theta$ like this尽量拟合数据:
在这里插入图片描述
为了求出最适合的 $\theta$ 我定义一个代价函数

$J(\theta0 , \theta1)=\frac{1}{2m} \sum _{i=0}^{M}(h_{\theta}(x^{i})-y^{i})^{2}$
minimize $J(\theta0 , \theta1)$
我们将使用梯度下降算法minimize $J(\theta0 , \theta1)$ ，以及得到相应的 $\theta$
这是梯度下降算法的工作图，我们随机挑选一个点，不断改变 $\theta$ ，使代价函数最小化或局部最小
这是初始点
在这里插入图片描述
工作过程

或初始化令一个随机点like this

这样我们就得到了最小化代价函数的 $\theta$
这是其背后的数学公式：
$\Theta _{j}:=\Theta _{j}-\alpha \frac{\partial J(\theta0 , \theta1)}{\partial \Theta _{j}}$ (这里j=0或1)
不断的重复更新 $\theta$ like this这是带进去之后的结果
在这里插入图片描述