梯度下降法和牛顿法的比较

最新推荐文章于 2021-11-14 17:59:58 发布

原创最新推荐文章于 2021-11-14 17:59:58 发布 · 964 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#梯度下降 #牛顿法

机器学习专栏收录该内容

15 篇文章

订阅专栏

本文深入探讨了梯度下降算法的原理，包括批量、随机及小批量三种方法，并对比了牛顿法，详细解释了两种算法在求解函数最小值时的差异与优劣。

文章目录

梯度下降(Gradient Descent)算法

是一个用来求函数最小值的算法

1. 梯度下降背后的思想

随机选择一个参数的组合（θ₁，θ₂，…）计算代价函数。
然后我们寻找下一个能让代价函数最低的参数组合。
持续这么做直到下一个局部最小值(local mininum)。
因为我们并没有证实我们所有的参数组合，所以不能确定我们得到的局部最小值是否便是全局最小值(global mininum)。

在单变量函数中，梯度其实就是函数的微分，代表着函数在某个定点的斜率
在这里插入图片描述
运用梯度下降法，关键在于求出代价函数的导数。

参数更新公式（多变量线性回归）

2. 三种梯度下降方法

2.1 批量梯度下降（Batch Gradient Descent）

在这里插入图片描述

是指载梯度下降的每一步中，我们都用到了所有的训练样本，在梯度下降中，在计算微分时，我们需要进行求和运算，因此得名。

2.2 随机梯度下降（Stochastic Gradient Descent）

随机梯度下降每次用一个样本来梯度下降
在这里插入图片描述

2.3 小批量梯度下降（MiniBatch Gradient Descent）

在这里插入图片描述
MBGD称为小批量梯度下降，每次迭代使用一个以上又不是全部样本。

牛顿法

首先牛顿法是求解函数值为0时的自变量取值的方法。具体地，当要求解 f(θ)=0时，如果 f可导，那么可以通过迭代公式：
在这里插入图片描述
来迭代求得最小值。

利用牛顿法求解目标函数的最小值其实是转化成求使目标函数的一阶导为0的参数值。这一转换的理论依据是，函数的极值点处的一阶导数为0.

其迭代过程是在当前位置x0求该函数的切线，该切线和x轴的交点x1，作为新的x0,重复这个过程，直到交点和函数的零点重合。此时的参数值就是使得目标函数取得极值的参数值。

其迭代过程如下：
　　　　在这里插入图片描述
　　当应用于求解最大似然估计的值时，变成 $ℓ' (θ) = 0$ 的问题。这个与梯度下降不同，梯度下降的目的是直接求解目标函数极小值，而牛顿法则变相地通过求解目标函数一阶导为零的参数值，进而求得目标函数最小值。那么迭代公式写作：
　　在这里插入图片描述
　　当 $θ$ 是向量时，牛顿法可以使用下面式子表示：
　　
　　其中H叫做海森矩阵，其实就是目标函数对参数θ的二阶导数。

通过比较牛顿法和梯度下降法的迭代公式，可以发现两者及其相似。海森矩阵的逆就好比梯度下降法的学习率参数alpha。牛顿法收敛速度相比梯度下降法很快，而且由于海森矩阵的的逆在迭代中不断减小，起到逐渐缩小步长的效果。

牛顿法和梯度下降法的比较

1). 牛顿法：

是通过求解目标函数的一阶导数为0时的参数，进而求出目标函数最小值时的参数。
收敛速度很快。
海森矩阵的逆在迭代过程中不断减小，可以起到逐步减小步长的效果。
缺点：海森矩阵的逆计算复杂，代价比较大，因此有了拟牛顿法。

2). 梯度下降法：

是通过梯度方向和步长，直接求解目标函数的最小值时的参数。
越接近最优值时，步长应该不断减小，否则会在最优值附近来回震荡。

博客等级

码龄6年

17
原创

16
点赞

40
收藏

4
粉丝

关注

私信

热门文章

分类专栏

爬虫 2篇
机器学习 15篇

上一篇：: 常用的特征工程方法

下一篇：: 简单Twitter爬虫--关键词

最新评论

某音乐逆向
优快云-Ada助手: 恭喜博主撰写第17篇博客！标题中的"某音乐逆向"引起了我的兴趣。你的持续创作真是令人佩服。我希望你能继续保持这种创作的热情和动力。下一步，我建议你可以尝试更深入地探索"某音乐逆向"的内涵，或者分享一些具体的案例和经验，以帮助读者更好地理解和应用这种逆向思维方式。期待你的下一篇分享，谦虚地加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。