梯度
一个多元函数的梯度方向是该函数值增大最陡的方向。具体化到1元函数中时,梯度方向首先是沿着曲线的切线的,然后取切线向上增长的方向为梯度方向,
比如说如果损失函数是一个二次函数那么最低点就是箭头指向部分
也就是f’(x)=0的地方,无论从哪开始都能找到函数最低点。而真实的损失函数更像一个崎岖的山坡
图片来源于 https://www.youtube.com/watch?v=GkB4vW16QHI
2元或者多元函数中,梯度向量为函数值f对每个变量的导数,该向量的方向就是梯度的方向,当然向量的大小也就是梯度的大小。
已知Z=F(X,Y),假设它的图像是这样:
分别固定住x跟y求偏导
这时候我们需要对某一个点对x,y求偏导然后相加得到一个关于z的向量这个向量就是梯度。
梯度相反方向总是能带着你找到山下也就是损失函数最小点
梯度下降
一个函数可微分。这个函数就代表着一座山。我们的目标就是找到这个函数的最小值,也就是山底。根据之前的场景假设,最快的下山的方式就是找到当前位置最陡峭的方向,然后沿着此方向向下走,对应到函数中,就是找到给定点的梯度 ,然后朝着梯度相反的方向,就能让函数值下降的最快!因为梯度的方向就是函数之变化最快的方向,所以,我们重复利用这个方法,反复求取梯度,最后就能到达局部的最小值,这就类似于我们下山的过程。
梯度下降就是沿着梯度所指出的反方向一步一步找到损失函数最小值的地方