梯度下降算法

最新推荐文章于 2023-03-10 15:56:41 发布

ITYTI

最新推荐文章于 2023-03-10 15:56:41 发布

阅读量578

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习梯度下降算法梯度下降算法实践

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ITYTI/article/details/82431342

机器学习专栏收录该内容

2 篇文章

订阅专栏

梯度下降法(gradient descent)是一个最优化算法，常用于机器学习和人工智能当中用来递归性地逼近最小偏差模型。

梯度下降的损失函数是通过迭代法一步步求解，得到最优解。

1.假设函数

2.代价函数的公式

3. 损失函数的可视化图

4.批量梯度下降公式（BGD）

其中a为学习率

如果a太大，那么梯度下降算法可能汇越过最低点，甚至可能无法收敛

如果a太小，每次移动很小步，这样需要很多步才能到达最低点

5.多变量梯度下降

其中x0=1

下图为单变量和多变量的对比

6.梯度下降法实践——特征尺度

在我们解决多为特征问题的时候，我们要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快的收敛。

方法是：

1.尽量将所有的特征缩放到-1到1之间（理想情况）

2.归一化

其中u为平均值，S为标准差（即最大值-最小值）

7.正规方程解向量

经数学证明使用线性代数也可以直接求解特征向量，使得代价函数J()最小

8.梯度下降与正规方程的比较

总的来说，只要特征变量的数目并不大，具体的特征数量小于一万，正规方程是一种很好的方法；而特征数量比较大推荐使用梯度下降。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。