神经网络的优化（2）---- 滑动平均 ema

最新推荐文章于 2025-06-03 21:41:50 发布

/home/liupc

最新推荐文章于 2025-06-03 21:41:50 发布

阅读量1.8k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： 11 Python/DL/ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/pengchengliu/article/details/88296835

本文深入探讨了滑动平均（EMA）在神经网络优化中的作用。通过使用滑动平均，模型权重可以平滑更新，提高模型的泛化能力，尤其在训练不稳定或数据噪声较大时效果显著。文章详细解释了滑动平均的原理，并给出了实际应用中的配置建议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

点击此处返回总目录

这一节分享另一个优化方法：滑动平均。有些书里把它叫做“影子值”。滑动平均记录了每个参数一段时间内过往值的平均。由于滑动平均值不仅表现了当前值，还表现了过去一段时间内的平均值，这样可以增加模型的泛化性。

滑动平均通常针对所有参数进行优化，包括所有的w和b。

滑动平均的感觉就好比给参数加了个影子，参数变化，影子缓慢追随。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。