机器学习面试必知:拟牛顿法(DFP和BFGS)

牛顿法的特点就是收敛快。但是运用牛顿法需要计算二阶偏导数,而且目标函数的Hesse矩阵可能非正定。为了克服牛顿法的缺点,人们提出了拟牛顿法,它的基本思想是用不包含二阶导数的矩阵近似牛顿法中的Hesse矩阵的逆矩阵。

牛顿法的迭代公式
x ( k + 1 ) = x ( k ) + λ d ( k ) x^{(k+1)}=x^{(k)}+\lambda d^{(k)} x(k+1)=x(k)+λd(k) d ( k ) = − ▽ 2 f ( x ( k ) ) − 1 ▽ f ( x ( k ) ) d^{(k)}=-\bigtriangledown ^{2}f(x^{(k)})^{-1}\bigtriangledown f(x^{(k)}) d(k)=2f(x(k))1f(x(k))

为了构造 ▽ 2 f ( x ( k ) ) − 1 \bigtriangledown ^{2}f(x^{(k)})^{-1} 2f(x(k))1的近似矩阵 H k H_{k} Hk,我们先来分析 ▽ 2 f ( x ( k ) ) − 1 \bigtriangledown ^{2}f(x^{(k)})^{-1} 2f(x(k))1与一阶导数的关系。将 f ( x ) f(x) f(x)在点 x ( k + 1 ) x^{(k+1)} x(k+1)展开成泰勒级数 f ( x ) = f ( x ( k + 1 ) ) + ▽ f ( x ( k + 1 ) ) T ( x − x ( k + 1 ) ) f(x)=f(x^{(k+1)})+\bigtriangledown f(x^{(k+1)})^{T}(x-x^{(k+1)}) f(x)=f(x(k+1))+f(x(k+1))T(xx(k+1)) + 1 2 ( x − x ( k + 1 ) ) T ▽ 2 f ( x ( k + 1 ) ) ( x − x ( k + 1 ) ) +\frac{1}{2}(x-x^{(k+1)})^{T} \bigtriangledown ^{2}f(x^{(k+1)})(x-x^{(k+1)}) +21(xx(k+1))T2f(x(k+1))(xx(k+1))由此可知,在 x ( k + 1 ) x^{(k+1)} x(k+1)附近有 ▽ f ( x ) ≈ ▽ f ( x ( k + 1 ) ) + ▽ 2 f ( x ( k + 1 ) ) ( x − x ( k + 1 ) ) \bigtriangledown f(x) \approx \bigtriangledown f(x^{(k+1)})+\bigtriangledown ^{2}f(x^{(k+1)})(x-x^{(k+1)}) f(x)f(x(k+1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值