梯度下降算法

最新推荐文章于 2022-09-09 12:15:00 发布

原创最新推荐文章于 2022-09-09 12:15:00 发布 · 212 阅读

CC 4.0 BY-SA版权

8 篇文章

订阅专栏

梯度下降法用于最小化代价函数，通过不断调整参数寻找最优解。可能存在局部最优解问题，初始值的选择影响结果。多元梯度下降应用于多元线性回归，特征缩放能加速收敛。学习率的选择至关重要，过大可能导致不收敛或缓慢收敛，应尝试多种学习率观察曲线以确定合适值。

如果梯度下降已经到达了一个局部最优解，那么下一步梯度下降会怎么样？
答：参数将不再改变，如下图解释

在这里插入图片描述

将梯度下降算法应用到多元线性回归中
在这里插入图片描述

特征缩放
如果能够确保多个特征值得取值范围相近，会使得梯度下降算法收敛的更快。
在这里插入图片描述
关于特征缩放和均值归一化，详见这篇博客，博主总结很全
学习率，如何选择学习率
画出迭代曲线有助于我们判断是否梯度下降正常工作和是否已经收敛

数学家已经证明，如果学习率足够小那么每次迭代都会使得代价函数变小，当然学习率也不能太小，太小的话会收敛的非常慢。

经验
在运行梯度下降算法时，尝试多个学习率，0.001, 0.003，0.01, 0.03， 0.1, 0.3 ，1等，回执迭代步数变化的曲线，选择使得代价函数快速下降的学习率值