当我们得到一个目标函数后,如何求解,直接求解?(并不一定,线性回归可以当做一个特列)
常规过程:我先给机器一堆数据,然后告诉它什么样的学习方式是对的(目标函数 loss),然后让他那个方向这么做。
若把下图看作一座山
那我们想要找到山的最低点,我们先告诉机器随机来一组参数
,当前我们优化要让它下降,所以我们要让它向山的最低点走,看山上的红圈该怎么下山,我们在图中给出三种下山路线,我们不光要下山,我们要选一条最快方式下山的路线,显然沿着切线方向是最快的,要下山我们现在要求它的一个梯度(切点或切点方向),正常求出的梯度是一个上升的方向,此时,我们要的是下山,沿着一个梯度的反方向走,所以我们管这个优化算法叫做梯度下降