pytorch中指数移动平均ema权重的理解、opt理解-230618

xiekai1116

已于 2023-06-18 17:55:24 修改

阅读量346

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： pytorch

于 2022-04-03 20:08:39 首次发布

本文链接：https://blog.youkuaiyun.com/csdnxiekai/article/details/123943345

PyTorch 专栏收录该内容

7 篇文章

订阅专栏

本文探讨了PyTorch中的ExponentialMovingAverage (EMA) 在训练阶段如何用于提升网络性能，并揭示了其在模型权重管理和优化器文件大小上的影响。重点讲述了在forward函数中如何在训练和测试阶段区别使用模型和影子权重。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前理解ema权重是在train阶段使用，提升网络性能，在https://github.com/openai/improved-diffusion中一直没有找到train是ema权重的使用，变化的使用是model权重（如果使用的话还需要将ema权重数值传给model权重，然后得设置为有梯度），后来查找ema权重只在train中根据model权重更新，在测试时使用。
PyTorch: Exponential Moving Average (EMA) Example

def forward(self, inputs: Tensor, return_feature: bool = False) -> Tensor:
    if self.training:
        return self.model(inputs, return_feature)
    else:
        return self.shadow(inputs, return_feature)