初学算法——梯度下降法

最新推荐文章于 2025-01-16 11:18:19 发布

原创

最新推荐文章于 2025-01-16 11:18:19 发布 · 788 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了初学者如何使用梯度下降算法，强调了特征缩放法、均值归一化以及学习率调整在加快算法收敛速度中的作用。特征缩放有助于形成更直线的收敛路径，均值归一化是为了进一步加速收敛，而合适的学习率α值对避免不收敛或收敛过慢至关重要。

梯度下降算法

注：

:=是赋值的意思
右边错误是因为temp1中采用了更新后的θ0，而梯度下降算法中要求的是同时更新；右边是另外一种算法

α太大，可能会导致不收敛

线性代数知识：

矩阵的加减乘除算法、单位矩阵、逆矩阵运算、矩阵的转置定义相关知识

特征缩放法

目的：加快梯度下降算法的收敛速度。

问题描述：如上左图，如果取值θ1=（0 ，5），θ2=（0，2000），则代价函数的2D图会如左图所示，很狭长，在用梯度下降算法寻找最小值的路线可能是弯弯曲曲，需要废掉很长的时间；

当我将θ1，θ2取值分别除以他的取值长度5，2000后，得到的取值范围再画2D图（上右图），则寻找收敛值得曲线会是趋向于一条直线，故这样会大大加快收敛得速度

注：缩放之后的值不能太小，也不能太大；经验值：（-3，3）之间都能接受。

均值归一化

目的：加快梯度下降算法的收敛速度

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。