原文指路→https://www.sohu.com/a/100533380_176628
参考学习→https://blog.youkuaiyun.com/weixin_34343689/article/details/87979785
梯度下降:简单来说就是一种寻找目标函数最小化的方法。根据梯度(导数)的符号来判断最小值点x在哪。即找到函数的最小值
所对应的自变量的值(曲线最低点对应x的值)。
[梯度就是导数(对于多维就是偏导数)]
△ 梯度下降的过程:
①求导。导数值大于0,函数单调递增。x增大函数值也会增大。则寻找比x小的点;
反之,导数值小于0,函数单调递减。x增大函数值减小。则寻找比x大的点;
②重复①的过程,直到f'(x)==0,此时就找到了最小值所在的那个点