机器学习面试必知:拟牛顿法(DFP和BFGS)

牛顿法的特点就是收敛快。但是运用牛顿法需要计算二阶偏导数,而且目标函数的Hesse矩阵可能非正定。为了克服牛顿法的缺点,人们提出了拟牛顿法,它的基本思想是用不包含二阶导数的矩阵近似牛顿法中的Hesse矩阵的逆矩阵。

牛顿法的迭代公式
x(k+1)=x(k)+λd(k)x^{(k+1)}=x^{(k)}+\lambda d^{(k)}x(k+1)=x(k)+λd(k)d(k)=−▽2f(x(k))−1▽f(x(k))d^{(k)}=-\bigtriangledown ^{2}f(x^{(k)})^{-1}\bigtriangledown f(x^{(k)})d(k)=2f(x(k))1f(x(k))

为了构造▽2f(x(k))−1\bigtriangledown ^{2}f(x^{(k)})^{-1}2f(x(k))1的近似矩阵HkH_{k}Hk,我们先来分析▽2f(x(k))−1\bigtriangledown ^{2}f(x^{(k)})^{-1}2f(x(k))1与一阶导数的关系。将f(x)f(x)f(x)在点x(k+1)x^{(k+1)}x(k+1)展开成泰勒级数f(x)=f(x(k+1))+▽f(x(k+1))T(x−x(k+1))f(x)=f(x^{(k+1)})+\bigtriangledown f(x^{(k+1)})^{T}(x-x^{(k+1)}) f(x)=f(x(k+1))+f(x(k+1))T(xx(k+1))+12(x−x(k+1))T▽2f(x(k+1))(x−x(k+1))+\frac{1}{2}(x-x^{(k+1)})^{T} \bigtriangledown ^{2}f(x^{(k+1)})(x-x^{(k+1)}) +21(xx(k+1))T2f(x(k+1))(xx(k+1))由此可知,在x(k+1)x^{(k+1)}x(k+1)附近有▽f(x)≈▽f(x(k+1))+▽2f(x(k+1))(x−x(k+1))\bigtriangledown f(x) \approx \bigtriangledown f(x^{(k+1)})+\bigtriangledown ^{2}f(x^{(k+1)})(x-x^{(k+1)})f(x)f(x(k+1))+2f(x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值