7、随机梯度下降（SGD）在Scikit - learn中的应用与参数调优

最新推荐文章于 2025-09-20 22:59:29 发布

元编程奶

最新推荐文章于 2025-09-20 22:59:29 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：驾驭大规模机器学习文章标签：随机梯度下降 SGD Scikit-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b9c0d/article/details/152498069

驾驭大规模机器学习专栏收录该内容

29 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

随机梯度下降（SGD）在Scikit - learn中的应用与参数调优

1. 随机梯度下降概述

传统的梯度下降方法是全批量梯度下降，它通过优化整个数据集的误差来工作，因此需要将整个数据集加载到内存中。而随机梯度下降（SGD）和小批量梯度下降则是适用于处理无法全部加载到内存中的数据的方法。

SGD的核心思想是，每次只对一个实例进行更新，这样可以将核心数据存储在外部存储设备中，只将单个观测值加载到内存中。如果实例是随机选取且无特定偏差的，那么优化过程平均而言会朝着目标成本最小化的方向进行。例如在共享单车的例子中，如果SGD先学习早期季节的模式，再关注夏季、秋季等，那么模型可能会根据优化停止时的季节，对某个季节的预测效果更好，因为最近的大部分示例都来自该季节。当数据独立同分布（i.i.d.）时，SGD能保证收敛到全局最小值。实际应用中，i.i.d.意味着数据示例应无顺序或分布规律，就像从可用数据中随机选取一样。

2. Scikit - learn中的SGD实现

Scikit - learn包中有许多在线学习算法。对于监督学习，可将可用的学习器分为分类器和回归器。

2.1 分类器

sklearn.naive_bayes.MultinomialNB
sklearn.naive_bayes.BernoulliNB
sklearn.linear_model.Perceptron
sklearn.linear_model.PassiveAgg

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。