最速下降法与牛顿法的收敛速率

本文探讨最速下降法和牛顿法在优化问题中的收敛速率。最速下降法线性收敛,其收敛速度受条件数影响,而牛顿法则在满足条件下能实现二阶收敛,比最速下降法更快。通过实例和理论分析,展示了两种方法在解决二次规划问题时的不同表现。

在MIT的公开课[Introduction to Computer Science and Programming Using Python] 6.00.1x 中,Eric Grimson曾提到过迭代算法的思想就在于将当前迭代点向正确的方向移动一定的“步长”,然后检验目标值是否满足一定要求。同时,“方向”和“步长”也是不同优化算法主要关心的两个方面。除此之外,我们还关心不同优化算法的收敛速率(rate of convergence),这表征了算法是否能在尽量少的迭代次数之外逼近最优解。本文以最速下降法(Steep Descent)和牛顿法(Netwon Method)为例,说明不同算法的收敛速率。本文主要参考了Jorge Nocedal 和 Stephen J. Wright 的 Numerical Optimization 一书(第二版)。

最速下降法(Steep Descent)

最速下降法的思路是以当前迭代点的导数方向的相反方向,也就是下降最快的方向(名字由来),为前进方向。步长选取的一种思路是选择相应的步长使得目标函数取在前进方向上取得最小值。

这里我们以一个简单的二次规划命题为例进行说,即

f(x)=12xTQx+cTx
其中 Q 是对称正定阵。对于目标函数 f(x) ,记当前的迭代点为 xk f(x) xk 处的一阶导数为 fk=Qx+c 。于是在 xk 处的前进方向即为 fk 。 要确定前进的步长,即要是的下面这个以 α 为决策变量的优化命题取得最小值:
f(xαfk)=12(xαfk)TQ(xαfk)+c
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值