pytorch实现的时候非常需要的基础知识:(参考:pytorch 拷贝和梯度回传的问题 - 知乎) pytorch实现:(参考一下博客:深度学习 性能提升技巧--指数加权平均(EMA)Pytorch实现_白又白胖又胖的博客-优快云博客_ema pytorchEMA 指数滑动平均原理和实现 (PyTorch) - 知乎)