梯度下降法和(拟)牛顿法区别及介绍

最新推荐文章于 2023-10-19 11:42:07 发布

原创

最新推荐文章于 2023-10-19 11:42:07 发布 · 9.4k 阅读

·

10

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #人工智能 #凸优化 #最优化问题

本文介绍了梯度下降法和牛顿法在求解无约束最优化问题中的应用，包括它们的基本原理、区别与对比。梯度下降法作为一阶优化算法，适合大规模问题但收敛速度较慢；牛顿法则通过二阶信息快速收敛，但计算成本高。在实际中，由于牛顿法对初始值敏感且计算复杂，常采用拟牛顿法，如DFP、BFGS和L-BFGS算法，以降低计算复杂度并保持较好的收敛性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

梯度下降法和牛顿法介绍

梯度下降法和牛顿法都是求解无约束最优化问题的常用方法。
假设 $f(x)$ 为 $\mathbf{R}^n$ 上具有一阶连续偏导数的函数，要求解的无约束最优化问题为

min x \in R n f (x)

$\min_{x \in \mathbf{R}^n} \ f(x)$

x∗x∗ $x^*$ 表示目标函数的极小点。下面分别介绍梯度下降法和牛顿法。

梯度下降法

梯度下降法是一种迭代算法。选取适当的初值 $x^{(0)}$ ，不断迭代，更新 $x$ 的值，进行目标函数的极小化，直到收敛。因为负梯度方向是使函数值下降最快的方向，在迭代的每一步，以扶梯度方向更新 $x$ 的值，从而达到减少函数值的目的。

由于 $f(x)$ 具有一阶连续偏导数，若第k次迭代值为 $x^{(k)}$ ，则可将 $f(x)$ 在 $x^{(k)}$ 附近进行一阶泰勒展开：

f (x) = f (x (k)) + g T k (x - x (k)) (1.1)

$f(x) = f(x^{(k)}) + g_k^T(x-x^{(k)}) \tag{1.1}$
这里，

gk=g(x(k))=∇f(x(k))gk=g(x(k))=∇f(x(k)) $g_k=g(x^{(k)}) = \nabla f(x^{(k)})$ 为

f(x)f(x) $f(x)$ 在

x(k)x(k) $x^{(k)}$ 处的梯度。

求出第k+1次迭代值 $x^{(k+1)}$ :

x (k + 1) \leftarrow x (k) + λ k p k (1.2)

$x^{(k+1)} \gets x^{(k)} + \lambda_k p_k\tag{1.2}$
其中，

pkpk $p_k$ 是搜索方向，取负梯度方向

pk=−∇f(x(k))pk=−∇f(x(k)) $p_k=-\nabla f(x^{(k)})$ ,

λkλk $\lambda_k$ 是步长，由一维搜索确定，即

λkλk $\lambda_k$ 使得

f (x (k) + λ k p k) = min λ \geq 0 f (x (k) + λ p k) (1.3)

$f(x^{(k)} + \lambda_k p_k) = \min_{\lambda \ge 0} f(x^{(k)} + \lambda p_k)\tag{1.3}$

牛顿法

牛顿法收敛速度快，每一步需要求解目标函数的海赛矩阵的逆矩阵，计算比较复杂，可通过拟牛顿法简化计算过程。

假设 $f(x)$ 具有二阶连续偏导数，若第k次迭代值为 $x^{(k)}$ ，则可在 $x^{(k)}$ 附近进行二阶泰勒展开：

f (x) = f (x (k)) + g T k (x - x (k)) + 1 2 (x - x (k)) T H (x (k)) (x - x (k)) (2.1)

$f(x) = f(x^{(k)}) + g_k^T(x-x^{(k)}) + \frac{1}{2}(x-x^{(k)})^T H(x^{(k)})(x-x^{(k)})\tag{2.1}$
这里，

gk=g(x(k))=∇f(x(k))gk=g(x(k))=∇f(x(k)) $g_k=g(x^{(k)}) = \nabla f(x^{(k)})$ 为

f(x)f(x) $f(x)$ 在

x(k)x(k) $x^{(k)}$ 处的梯度，

H(x(k))H(x(k)) $H(x^{(k)})$ 是

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。