梯度下降法及matlab实现

最新推荐文章于 2025-07-14 14:33:08 发布

qq_32216775

最新推荐文章于 2025-07-14 14:33:08 发布

阅读量2.2w

点赞数 9

CC 4.0 BY-SA版权

分类专栏：算法 matlab

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_32216775/article/details/86072396

本文介绍了梯度下降法在机器学习中的应用，作为参数调优的常用算法，通过迭代方式使代价函数减小。内容包括代价函数的定义、参数迭代调整公式以及学习率的影响。还展示了如何在MATLAB中实现梯度下降，探讨了不同模型下学习率的选择问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

个人博客文章链接：http://www.huqj.top/article?id=162

梯度下降法（gradient descent），是机器学习中最常用的参数调优算法，所谓梯度下降，就是对于一个模型的代价函数而言，从某个初始参数开始，逐渐将参数朝“使得代价函数减小最快”的方向调整，使得代价函数最终稳定在某个值左右。

举个例子，对于训练集数据：

1	`training_data` `=` `[1` `7.6;` `2` `15.8;` `3` `29;` `4` `45;` `5` `66.5;` `6` `91;` `10` `225];`

它的离散图像大致如下：

如果我们需要用一个函数来拟合它，那么最好是用一个二次或者更高次函数，假设我们使用二次函数：

y = θ0 + θ1x + θ2x2

来作为模型的函数表达式，那么我们就需要确定三个参数分别是多少才能够最大程度的符合训练数据，对于一次函数而言，我们知道可以使用最小二乘法来计算参数，同样，对于二次函数也有相应的数学方法可以确定参数值，但是一方面这样做不具有通用性，另一方面，也可能会出现没有最优解的情况，因此梯度下降法成为了一个较好的选择，它使用迭代的方式使得代价函数逐步减小，直到稳定在最小值附近，这样就可以得到参数的较优解。

梯度下降的数学原理如下：

①假设模型函数为 y = hθ(X)，其中θ和X都是n维向量。

②代价函数表示当取某个θ向量作为参数时，模型计算出的结果和实际结果的误差，通常使用如下的函数来表示：

J(θ) = 1/2m * ∑i=1:m(hθ(Xi) - yi)2

其中m为训练集的数据个数，Xi表示第i个数据的自变量向量，yi为第i组数据的因变量，θ为某个参数向量。

③参数θ的迭代调整方法：

带入上面的J(θ)和hθ(X)的定义可推导：

θj := θj - α(1/m) * ∑i=1:m(hθ(Xi) - yi)*Xi,j

这个写的可能有点不清楚，可以看下面这张图片里的公式：

这里描述了只有一个训练数

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。