12、寻找最小值的算法：从确定性到随机性的探索

最新推荐文章于 2025-11-12 05:30:00 发布

devops8pract

最新推荐文章于 2025-11-12 05:30:00 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习的数学基石文章标签：最小值算法牛顿法随机搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/devops8pract/article/details/151037125

深度学习的数学基石专栏收录该内容

58 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

寻找最小值的算法：从确定性到随机性的探索

在优化问题中，寻找函数的最小值是一个核心任务。不同的算法适用于不同的场景，各有其优缺点。下面将详细介绍几种常见的寻找最小值的算法。

1. 学习率与二次近似

在某些算法中，学习率的选择至关重要。对于校正项，存在如下误差范围：
[0 < \frac{1}{2}\delta^2\lambda_{min}|\nabla f(x_n)|^2 \leq \frac{1}{2}\delta^2\langle H_f(x_n)\nabla f(x_n), \nabla f(x_n)\rangle \leq \frac{1}{2}\delta^2\lambda_{max}|\nabla f(x_n)|^2]
如果校正项过大，不等式 (f(x_{n + 1}) < f(x_n)) 可能不成立。考虑最坏情况，当校正项取最大值时，需要满足：
[f(x_n) - \delta|\nabla f(x_n)|^2 + \frac{1}{2}\delta^2\lambda_{max}|\nabla f(x_n)|^2 < f(x_n)]
这等价于学习率 (\delta) 满足：
[\delta < \frac{2}{\lambda_{max}}]
若学习率满足上述条件，二次近似为 (f(x_{n + 1})) 提供的值将低于 (f(x_n))。

2. 牛顿法

假设 (f: \mathbb{R}^n \to \mathbb{R}) 是 (C^2) 类函数，(x_0 \in \mathbb{R}^n) 是 (f) 最小值的初始猜测点，且 (f) 在 (x_0) 的邻域

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。