论文链接:Bag of Tricks for Image Classification with Convolutional Neural Networks
针对cnn图像分类的一些tricks
迁移到其他任务比如检测语义分割上也有很好的效果
2019 cvpr
- baseline 的选择
- 在新的硬件上有效训练tricks
- 对ResNet-50进行微调
- 其他的一些训练tricks
- 其他应用上的迁移
baseline training procedure
根据http://torch.ch/blog/2016/02/04/resnets.html中优化的ResNet作为baseline。
-
训练
- 随机采样图片,decoder为float-32bit,[0,255]
- 随机裁剪矩形区域,比例[3/4,4/3],面积随机采样[8%,100%]。之后resize到224*224
- 0.5的概率水平翻转
- [0.6,1.4]色调,饱和度,亮度,uniform系数
- 增加PCA噪音,正态分布 N ( 0 , 0.1 ) \mathcal{N}(0,0.1) N(0,0.1)
- 归一化rgb通道, − [ 133.68 , 116.779 , 103.939 ] -[133.68,116.779,103.939] −[133.68,116.779,103.939]&& ÷ [ 58 , 393 , 57.12 , 57.375 ] \div[58,393,57.12,57.375] ÷[58,393,57.12,57.375]
-
验证
- 保持图片长宽比,resize最短边为256
- crop中心区域224*224
- normalize RGB channels similar to training.
-
初始化
- 卷积全连接 weights :Xavier初始化 参数值 from [ a , − a ] [a,-a] [a,−a], a = 6 / ( d i n + d o u t ) a=\sqrt{6/(d_{in}+d_{out})}