最速下降法杂记

最新推荐文章于 2024-01-09 01:12:58 发布

原创

最新推荐文章于 2024-01-09 01:12:58 发布 · 2.9k 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

最速下降法是无约束最优化问题的基础算法，它沿负梯度方向迭代以降低目标函数值。与梯度下降法不同的是，最速下降法在每次迭代中寻找目标函数在搜索方向上的最小值。算法的搜索方向在相邻迭代中正交，以避免目标函数值继续下降。在机器学习和深度学习中，学习率（步长）作为超参数调整，因为实际损失函数的复杂性使得一维搜索确定最佳学习率变得困难。因此，更快速的收敛方法通常涉及二阶方法或改进的一阶方法，如动量法和Adam算法。

本文参考书籍最优化方法，部分参考漫步最优化三十二——最速下降法

最速下降法作为求解无约束最优化问题的入门算法，其思想是很多其他优化算法的基础。之前我一直对梯度下降法和最速下降法之间的关系和差异理解不清楚，只知道他们都是一阶方法，都沿负梯度方向迭代降低目标函数值，查了很多资料和网上的教程，发现讲得较为繁琐。经过系统学习和思考后我认为，最速下降法是梯度下降法的一种，该算法与一般梯度下降的区别在于，每次迭代过程中都要求目标函数值下降到搜索方向下的最小值。

最速下降法算法步骤

给定目标函数： $minf(\boldsymbol x)$ ，给定算法终止条件，通常是给定某误差 $\varepsilon > 0$ 。
取初始点 $\boldsymbol x_{0}$ ，令 $k =$ 0。
计算 $\boldsymbol g_{k} = \boldsymbol g(\boldsymbol x_{k}) =\bigtriangledown f(\boldsymbol x_{k})$ 。
若 $\left\|\boldsymbol g_{k}\right\| \leq \varepsilon$ ，则 $\boldsymbol x^*=\boldsymbol x_{k}$ ，算法终止；否则，令搜索方向 $\boldsymbol p_{k}=-\boldsymbol g_{k}$ ，由一维精确搜索或近似搜索求步长 $a_{k}$ ，使得：
$f(\boldsymbol x_{k}+a_{k}\boldsymbol p_{k})=minf(\boldsymbol x_{k}+a\boldsymbol p_{k})$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。