可能需要使用正则化的网络:
1.网络中有较多稀疏特征,当稀疏特征大量为0时可能导致相应的权重很大,网络叠加之后容易出现overfit。实现方式可以用torch optimizer中的weight decay,也可以自己用将weight的L2或者L1计算出来后叠加到loss上。pytorch实现L2和L1正则化regularization的方法_pan_jinquan的博客-优快云博客_pytorch 正则化pytorch实现L2和L1正则化的方法目录目录pytorch实现L2和L1正则化的方法1.torch.optim优化器实现L2正则化2. 如何判断正则化作用了模型?2.1 未加入正则化loss和Accuracy2.1 加入正则化loss和Accuracy2.3 正则化说明3.自定义正则化的方法3.1 自定义正则化Regularization类3.2...https://blog.youkuaiyun.com/guyuealian/article/details/88426648