参考:https://baike.baidu.com/item/%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D/4864937?fr=aladdin
定位
梯度下降是迭代法的一种,用来求解最小二乘法问题。
计算方法
迭代公式:
其中s−(k)\overset{-(k)}{s}s−(k)表示代表梯度负方向,ρk\rho _{k}ρk表示梯度方向上的搜索步长,也就是学习速率。
- 步长的确定:大了容易发散,小了收敛速度会慢
举例

求该函数的最小值:
①求梯度,即求导,即2x
②进行迭代,即向相反的反向移动x。迭代公式为x←x−λ∗梯度x\leftarrow x-\lambda *梯度x←x−λ∗梯度,λ\lambdaλ是步长。
当几次迭代出来的函数值几乎没有变化时,就说明函数达到了局部的最小值。
梯度下降是一种迭代优化算法,常用于求解最小二乘问题。其基本思想是沿着函数梯度的负方向更新参数,以逐步接近函数的局部最小值。在迭代过程中,学习速率(步长)的选取至关重要,过大可能导致发散,过小则影响收敛速度。通过不断迭代,当函数值变化微小时,可认为找到了局部最小值。
1147

被折叠的 条评论
为什么被折叠?



