CNN中卷积神经网络的技巧trick总结（图像识别/目标检测/语义分割）

原创

于 2018-12-21 11:32:27 发布 · 4.7k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#卷积神经网络 #深度学习技巧 #神经网络tricks

本文总结了卷积神经网络（CNN）在图像识别、目标检测和语义分割任务中的优化技巧，包括预处理策略、参数初始化、训练过程的优化，如批量训练、学习率调整、模型结构改进等，还探讨了这些技巧在迁移学习中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CNN图像分类的tricks

Baseline：

预处理：

随机抽取一张图片，解码成32位浮点型的[0,255]的像素值形式
随机在原图上裁剪一片比例在[3/4, 4/3]，面积在[8%, 100%]的矩形区域，然后resize到224x224
按0.5的概率对上一步的图片水平翻转
在[0.6, 1.4]之间均匀采样系数用于缩放色调、饱和度和亮度(HSB)
按正态分布N(0, 0.1)采样系数，用于添加一个PCA噪声
在图片的RGB通道上分别减去123.68，116.779，103.939然后除以58.393，57.12，57.375进行归一化。

验证：
保持验证图片的比例不变，将短边缩放到256，然后在其正中裁剪一块224x224的区域，并按和预处理中一样进行归一化。

参数初始化：

卷积层和全连接层的参数都是用Xavier算法初始化，使用中会将参数在[-a,a]之间均匀随机选取，a又由输入输出通道数决定a=sqrt(6/(in_channels+out_channels))。所有的bias都初始化为0。BN层的γ初始化为全1向量，β初始化为全0向量。

训练过程：

梯度更新策略使用NAG，每个模型在8个V100上训练120个epoch，batch size为256，学习率初始化为0.1，每30epoch衰减为1/10。

充分利用硬件：

<

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。