学习率调参问题

最新推荐文章于 2025-05-06 22:40:14 发布

__William__

最新推荐文章于 2025-05-06 22:40:14 发布

阅读量1w

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Machine Learning 文章标签： TensorFlow Machine Learning Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/willduan1/article/details/78075334

本文探讨了学习率调参的重要性，介绍了学习率衰减和对数均匀取值两种方法。学习率衰减包括指数衰减和倒数衰减等，用于初期快速迭代后期避免过拟合。学习率对数均匀取值则解决了均匀取值在某些范围内的不均匀问题。这两种方法结合使用，可帮助模型找到更好的学习率并实现有效收敛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习率调参一直是我们调参中非常重要的一个点，如果设置的太大，会导致网络跳过最优值，如果设置的太小，会导致学习的收敛速度太慢。

本文主要讲两种学习率的调参方法：学习率衰减和学习率对数均匀取值。

1. 学习率衰减

学习率衰减问题主要是让学习率前期以一个较大的学习率来训练，使得模型快速迭代，训练收敛，而后期为了使得模型不跳过最优点，我们就需要将学习率以一个较小的值来迭代，所以主要就是将学习率设置为从大到小来逐步训练。需要注意的是，这里学习率的调整不是一个iteration调整一次，而是一个epoch结束之后调整一次。

主要有以下几种调整方法（设置 t 为第 t 次epoch）：

（1）第一种是设置一个和 t 成反比形式的学习率函数：

decay_rate 在上面的公式中也是需要我们调试的一个超参数，例如可以设置初始值为1.

（2）设置一个学习率的指数衰减

公式中m也是我们需要微调的一个超参数，范围为0～1。例如可以取值为0.95.

（3）另一种形式的学习率衰减方法是设置 t 的开方取倒数。

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄14年

64
原创

382
点赞

1561
收藏

205
粉丝

关注

私信

热门文章

分类专栏

杭电OJ 3篇
杂谈 11篇
Android 3篇
struts 2篇
struts2 2篇
leetcode 35篇
推荐算法及系统 1篇
Machine Learning 17篇

展开全部收起

上一篇：: 集成学习总结 & Stacking方法详解

下一篇：: 深度学习优化算法解析(Momentum, RMSProp, Adam)

最新评论

基于深度学习的色情视频鉴定
2401_82990522: cd open_nsfw
基于深度学习的色情视频鉴定
2401_82990522: docker build -t caffe:cpu https://raw.githubusercontent.com/BVLC/caffe/master/docker/cpu/Dockerfile
深度学习优化算法解析(Momentum, RMSProp, Adam)
帅翰GG: 我和您交流一下，我认为在关于RMSprop那一部分说的不是很准确：“虽然初步解决了优化中摆动幅度大的问题。所谓的摆动幅度就是在优化中经过更新之后参数的变化范围，如下图所示，蓝色的为Momentum优化算法所走的路线，绿色的为RMSProp优化算法所走的路线。”这句话。实际上RMSprop算法与动量梯度下降本质上都是为了解决减缓纵坐标方向上的波动幅度，增大或至少不减慢横坐标的速度，从而达到加速梯度下降的目的。二者只是侧重点不同，动量梯度下降侧重的是模拟物理动量概念，增加更新在同一方向上的持续性和稳定性。而RMSProp侧重是调整学习率，让学习率在各个方面自适应。而您说的那个蓝色的线，其实还是吴恩达老师说的 min-batch梯度下降的效果
集成学习总结 & Stacking方法详解
冯诺依曼关门弟子: 感觉应该是 pred = lgb.predict(xxxxxx) 训练完lgb之后，用lgb.predict()就可吧应该。没有试过，感觉应该是这样~
集成学习总结 & Stacking方法详解
ZZ997241791: 哥，解决了吗，我没想明白怎么进行新数据的预测

大家在看

乞丐哥的私房菜（Ubuntu OpenCV篇——Image Processing 节之 Histogram Calculation 直方图计算）二十二 627

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。