《机器学习》梯度下降

最新推荐文章于 2025-07-10 22:51:54 发布

aszxqw

最新推荐文章于 2025-07-10 22:51:54 发布

阅读量1.5w

点赞数

CC 4.0 BY-SA版权

文章标签： matrix c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wuyanyi/article/details/8003946

本文介绍了机器学习中如何使用梯度下降法寻找线性函数的最优参数。通过误差函数衡量拟合效果，梯度下降策略用于找到使得误差最小的权重向量。讨论了梯度下降的计算过程，包括标准梯度下降和随机梯度下降的差异，并提供了一个代码实例链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参照《机器学习》这本书的第4.4.3节。

一.解决目标及情景假设:

当给定一些数据，输入x向量已知，输出y也已知，设计一个线性函数y=h（x）去拟合这些数据。

既然是线性函数，在此不妨设为h（x）=w0*x0+w1*x1。

此时我们遇到的问题就是如何确定w0和w1这两个参数，即w=（w0，w1）这个向量。

既然是拟合，则拟合效果可以用误差函数：E（w）=∑ [ h（x）- y ] ^2 / 2 来衡量。

其中w是权重二维向量，x是输入二维向量，x和y都是训练集的数据，即已知。

至于后面除于2只是为了之后的推导过程中对E求导时候可以消除系数，暂时可以不管。

因为我们解决的目标是找出一个向量w=（w0，w1）使得E(w)值最小，即误差最小。

其实这个问题本质上也是搜索最优解的问题，如果用暴力搜索的话，随机取每个可能的值去让机器每天每夜地跑，显然这是不可能的。
所以此时有一种搜索策略：梯度下降。

二. 梯度下降方法：

梯度其实就是高数求导方法，对E这个公式针对每个维数（w0，w1）求偏导后的向量▽E(w)=（∂E/∂w0,∂E/∂w1）

梯度为最陡峭上升的方向，对应的梯度下降的训练法则为：

w=w-η▽E(w)

这里的η代表学习速率，决定梯度下降搜索中的步长。

上式的w是向量，即可用将该式写成分量形式为:wi=wi-η*∂E/

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。