最优化之梯度下降(上升)算法
1、梯度下降算法原理
梯度下降(上升)法基于的思想是:要找到某函数的 最小(大)值,最好的方法是沿着该函数的梯度(反)方向探寻。如果梯度记为,则函数f(x,y)的梯度由 下式表示:
,这是机器学习中最易造成混淆的一个地方,但在数学上并不难,需要做的只是牢记这些符号的意义。这个梯度意味着要沿x的方向移动
,沿y的方向移动
,其中,函数’f(x,y)必须要在待计算的点上有定义并且可微。
梯度下降(上升)算法每次沿梯度(反)方向移动一步。梯度算子总是指向函数值减少(增加)最快的方向。这里所说的是移动方向,而未提到移动量的大小。该量值称为步长,记作。用向量来表示的话,梯度算法的迭代公式如下: