2017年深度学习优化算法最新进展：改进SGD和Adam方法

最新推荐文章于 2025-07-17 21:58:16 发布

AI算法网奇

最新推荐文章于 2025-07-17 21:58:16 发布

阅读量5.3k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习宝典

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/jacke121/article/details/81430629

深度学习宝典专栏收录该内容

1041 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了2017年深度学习优化算法的进展，重点探讨了如何改进随机梯度下降（SGD）和Adam方法。文章提到了AMSGrad、SGDR（余弦退火）等策略，以及调整学习率和权值衰减对模型性能的影响。同时，文章指出自适应学习率方法可能不如传统SGD在某些任务中的表现，并提出了解耦权值衰减的概念。此外，文中还讨论了学习率退火方案的重要性和快照集成技术。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法

转载的文章，把个人觉得比较好的摘录了一下

AMSGrad 这个前期比sgd快，不能收敛到最优。

sgdr 余弦退火的方案比较好

最近的一些研究（Dozat and Manning, 2017[13]、Laine and Aila, 2017[16]）通过实验发现，调低β2值，影响了Adam方法中过去平方梯度的指数移动平均值的贡献度。一般来说，β2的默认值为0.999，设置为0.99或0.9后，在不同任务中表现更好，这表明可能存在指数移动平均值的问题。

关于这个，在yolov3的环境里，我试了一下，没有发现更好

Zhang在2017年的一个研究表明[2]，在调整学习率退火方案和动量参数后，该SGD方法的性能与Adam有得一拼，而且收敛速度更快。另一方面，我们可能认为Adam方法中学习率的自适应性可能模仿了学习速率退火，但是一个明确的退火方案仍然是有帮助的。因为，如果我们把SGD方法中的学习率退火添加到Adam中，它能在机器翻译任务中表现得比SGD方法更好，且更快地收敛[4]。

事实上，学习率退火方案似乎是一种新的特征工程，因为我们发现，改进的学习率退火方案能改善模型的最终收敛性能。

了解本专栏

超级会员免费看

博客等级

码龄16年

Python领域优质创作者

博客专家认证

5906
原创

1万+
点赞

2万+
收藏

9万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 定点量化误差python仿真.零极点(1)

下一篇：: 行人识别学习资料整理2018

最新评论

tensorrt动态输入分辨率尺寸
️好景多长: 我是在c++用tensorrt实现的，加了setOptimizationProfile(0)以后还是不能设置(context_->setBindingDimensions(input_idx, Dims4(batch_size, channel, imgsz, imgsz)) 这个函数返回的的确是true，但是后面输入时的尺寸仍然是(batch_size, channel, -1， -1)，并且报错： TensorRT: 3: [executionContext.cpp::nvinfer1::rt::ExecutionContext::setBindingDimensions ::1511] Error Code 3: API Usage Error (Parameter check failed at: executionContext.cpp ::nvinfer1::rt::ExecutionContext::setBindingDimensions::1511, condition: mEngine.bingingIsInput(bindingIndex)
图生360度部署 Panodiff
qq_37637914: 你好，请问现在还有这些数据集吗，目前我看到sun360链接打不开
module ‘tensorflow‘ has no attribute ‘Tensor‘
lcathm: 最简单的方法就是用 pip install tensorflow==2.11.0，将版本降低并兼容。
Windows10 使用Glint360K数据集
何小义的AI进阶路: 我的解压老是报错说压缩文件有问题就是那个glint360k_00 也没有后缀名还有01 02 ...06 一共七个，加readme.txt
cannot import name ‘TypeAliasType‘ from ‘typing_extensions‘
小城心语: 谢谢，成功解决

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI算法网奇 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。