IBN-Net ResNetIBN的原理以及DSBN的代码

最新推荐文章于 2025-04-17 07:46:36 发布

原创

最新推荐文章于 2025-04-17 07:46:36 发布 · 4.1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #深度学习 #机器学习 #人员定位

IBN-Net

IBN-Net由《Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net》这篇文章提出。
归一化层，目前主要有这几个方法，Batch Normalization（2015年）、Layer Normalization（2016年）、Instance Normalization（2017年）、Group Normalization（2018年）、Switchable Normalization（2018年）；
将输入的图像shape记为[N, C, H, W]，这几个方法主要的区别就是在
在这里插入图片描述

batchNorm是在batch上，对NHW做归一化，对小batchsize效果不好；
layerNorm在通道方向上，对CHW归一化，主要对RNN作用明显；
instanceNorm在图像像素上，对HW做归一化，用在风格化迁移；
GroupNorm将channel分组，然后再做归一化；
SwitchableNorm是将BN、LN、IN结合，赋予权重，让网络自己去学习归一化层应该使用什么方法。
根据BN和IN的定义， BN是增加样本间的差异，IN是提高对亮度，色调变化的鲁棒性。
在这里插入图片描述
这个作者用resnet50，分别在两对样本集上训练，横坐标是层的索引，纵坐标是特征差异（论文最后有对特征差异的定义，高斯+KL散度）。
蓝色柱状图是resnet50在Imagenet和其对应的monet版本，二者最大的差异是颜色