梯度下降 from 吴恩达的机器学习

最新推荐文章于 2024-05-14 12:11:29 发布

翻译最新推荐文章于 2024-05-14 12:11:29 发布 · 516 阅读

·

2

·

机器学习 from 吴恩达专栏收录该内容

39 篇文章

订阅专栏

本文介绍了一种用于求解函数最小值的算法——梯度下降法。该算法通过不断调整参数，使代价函数逐渐减小直至达到局部最小值。文中详细解释了批量梯度下降的工作原理及其迭代过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

梯度下降：用来求函数最小值的算法，使用梯度下降算法来求出代价函数的最小值。

梯度下降思想是：开始时我们随机选择一个参数的组合，计算代价函数，然后我们寻找下一个能让代价函数值下降最多的参数组合。我们持续这么做直到到到一个局部最小值（local minimum），因为我们并没有尝试完所有的参数组合，所以不能确定我们得到的局部最小值是否便是全局最小值（global minimum），选择不同的初始参数组合，可能会找到不同的局部最小值。

批量梯度下降（batch gradient descent）算法的公式为：

实现梯度下降算法的微妙之处是，在这个表达式中，如果你要更新这个等式，你需要同时更新

描述：对赋值，使得按梯度下降最快方向进行，一直迭代下去，最终得到局部最小值。其中是学习率（learning rate），它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子有多大。

在梯度下降法中，当我们接近局部最低点时，梯度下降法会自动采取更小的幅度，这是因为当我们接近局部最低点时，很显然在局部最低时导数等于零，所以当我们接近局部最低时，导数值会自动变得越来越小，所以梯度下降将自动采取较小的幅度，这就是梯度下降的做法。所以实际上没有必要再另外减小。

\

推导方法

”批量梯度下降”，指的是在梯度下降的每一步中，我们都用到了所有的训练样本，在梯度下降中，在计算微分求导项时，我们需要进行求和运算，所以，在每一个单独的梯度下降中，我们最终都要计算这样一个东西，这个项需要对所有个训练样本求和。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。