机器学习4 - 牛顿法求最值

本文详细介绍了牛顿法的数学原理及其推导过程,通过泰勒展开公式解释了牛顿法迭代更新参数的具体方式,并给出了求解多元函数极值问题的方法。

公式

θ(t+1)=θ(t)H1θl

海森矩阵

Hij=2lθiθj

推导

泰勒展开式

f(x)=f(x0)+f(1)(xo)(xx0)+...+f(n)(x0)n!(xx0)n+f(n+1)(xo+θ(xx0))(n+1)!(θ(xx0))n+1
多元函数泰勒展开

f(X)=f(X0)+(XX0)Tf(X0)+...+1n![(XX0)T]nf(X0)+1(n+1)![θ(XX0)T]n+1f(X0+θ(XX0))
取n=2

f(X)=f(X0)+(XX0)Tf(X0)+12(XX0)Tf(X0)Tf(X0)(XX0)+o(XX02)

f(X0)Tf(X0)=2f(X0)=H(X0)Hessian矩阵
X12(XX0)Tf(X0)Tf(X0)(XX0)=X12(XX0)TH(X0)(XX0)=12Xtr((XX0)TH(X0)(XX0))=12Xtr(XTH(X0)XX0TH(X0)XXTH(X0)X0+X0TH(X0)X0)=12Xtr(XXTH(X0))Xtr(XX0TH(X0))Xtr(XX0THT(X0))=12(H(X0)X+HT(X0)XHT(X0)X0H(X0)X0)=12(H(X0)+HT(X0))(XX0)=H(X0)(XX0)

Xf(X)=X(f(X0)+(XX0)Tf(X0)+12(XX0)Tf(X0)Tf(X0)(XX0))=f(X0)+H(X0)(XX0)

f(X)取最值时
Xf(X)==0

可得
(XX0)=H1(X0)f(X0)X=X0H1(X0)f(X0)
我的思路是这样的: 速下降法能找出全局优点,但在接近优点的区域内就会陷入“齿型”迭代中,使其每进行一步迭代都要花掉非常久的时间,这样长久的等待是无法忍受的,不信你就在我那个程序的第一步迭代中把精度取得很小如:0.000000001等,其实我等过一个钟都没有什么结果出来。 再者我们考究一下 牛顿迭代法优问题,牛顿法相对速下降法的速度就快得多了,而且还有一个好处就是能高度逼近,而不会出现死等待的现象。 如后面的精度,你可以取如:0.0000000000001等。 但是牛顿法也有缺点,就是要的初始非常严格,如果取不好,逼近的优解将不收敛,甚至不是优解。 就算收敛也不能保证那个结就是全局优解,所以我们的出发点应该是:为牛顿法找到一个好的初始点,而且这个初始点应该是在全局优点附近,这个初始点就能保证牛顿法高精度收敛到优点,而且速度还很快。 思路概括如下: 1。用速下降法在大范围找到一个好的初始点给牛顿法:(速下降法在精度不是很高的情况下逼近速度也是蛮快的) 2。在优点附近改用牛顿法,用速下降法找到的点为牛顿法的初始点,提高逼近速度与精度。 3。这样两种方法相结合,既能提高逼近的精度,还能提高逼近的速度,而且还能保证是全局优点。这就充分吸收各自的优点,扬长避短。得到理想的结果了。
根据狐獴种群生活习性,并从中受到启发,三位原作者由此开发出狐獴算法。现在假设有一个狐獴种群,总的个体数量为n,先初始化所有的相关参数,并根据适应度函数计算所有个体的适应度,选择适应度优者为哨兵,其数量为1。接下来, 剩余子群数量为(n-1),将剩余子群随机划分成两部分——觅食子群和保姆子群。 其次,将觅食子群个体进行更新,使得其整体质量要优于保姆子群,这一点也是符合狐獴种群的生活习性特征的。觅食子群中每一个个体从其本身产生邻域,并计算邻域的适应度,若其优于该个体,则替换该个体;否则,从哨兵个体产生邻域,同理,并计算邻域的适应度,若其优于该个体,则替换该个体,否则,将哨兵赋给该个体。这样,觅食子群整体变得较优。 再根据计算适应度和觅食子群和保姆子群的弱劣比例,选出觅食子群中弱劣个体,并用保姆子群中的优个体替换觅食子群中弱劣个体;而后,随机产生一组新个体来替换保姆子群中的弱劣个体。这样,觅食子群中的个体质量明显要优于保姆子群中的个体。 后,再根据适应度选出这时觅食子群中的优个体,若其优于哨兵,将其赋给哨兵即是。当然,上述这些步骤要循环进行,直至终止条件结束。那么,哨兵即是我们后所要找的优个体。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值