1 梯度下降
梯度的概念
梯度是微积分中一个很重要的概念
- 在单变量的函数中,梯度其实就是函数的微分,代表着函数在某个给定点的切线的斜率;
- 在多变量函数中,梯度是一个向量,向量有方向,梯度的方向就指出了函数在给定点的上升最快的方向;
- > 在微积分里面,对多元函数的参数求∂偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。
梯度的方向是函数在给定点上升最快的方向,那么梯度的反方向就是函数在给定点下降最快的方向
单变量函数的梯度下降
我们假设有一个单变量的函数
函数的微分:
初始化,起点为:
学习率:
我们开始进行梯度下降的迭代计算过程:
如图,经过四次的运算,也就是走了四步,基本就抵达了函数的最低点,也就是山底
多变量函数的梯度下降
我们假设有一个目标函数 :
现在要通过梯度下降法计算这个函数的最小值。我们通过观察就能发现最小值其实就是 (0,0)点。但是接下来,我们会从梯度下降算法开始一步步计算到这个最小值!
我们假设初始的起点为:
初始的学习率为:
函数的梯度为:
进行多次迭代:
梯度下降的公式
1、α在梯度下降算法中被称作为学习率或者步长,意味着我们可以通过α来控制每一步走的距离
- 控制参数不要走太快,错过了使损失函数取最小值的点。同