2.4 梯度下降法

最新推荐文章于 2025-02-01 17:25:39 发布

IAN27

最新推荐文章于 2025-02-01 17:25:39 发布

阅读量581

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/IAN27/article/details/108468130

版权

本文介绍了梯度下降法在训练深度学习模型时的作用，通过解释如何使用梯度下降法最小化成本函数J来优化参数w和b。内容包括成本函数的定义、初始化、学习率的概念以及二维函数图的示例，展示了梯度下降法如何通过更新参数逐步逼近全局最优解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

梯度下降法

如何使用梯度下降法来训练或学习训练集上的参数w和b。
在这里插入图片描述
之前，我们定义了logistic回归算法 y ̂以及成本函数 J。
这个成本函数J的参数是w和b。
定义为平均值，1/m 的损失函数之和。
其中的损失函数
可以衡量你的算法的效果，每一个训练样例都输出yi ̂，再把它与基本真值标签yi进行比较。
如果想要通过学习获得合适的参数w和b，就需要通过 找到一个 w，b值，能让成本函数J尽可能的小，这就需要使用到梯度下降法。
在这里插入图片描述
图形的高，代表了J(w,b)在某一点的值。我们需要做的就是，找到这个图形的最小值。
为了找到更好的参数值，我们要做的就是用某个初始值，去初始化w和b。对于，logistic回归而言，几乎任意的初始化方法都是有效的。通常使用0，或是任意值。但在logistic回归中，我们通常不这么做。因为函数是凸的，无论在哪里初始化，都应该达到同一个点或是大致相同的点。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。