CNN中卷积神经网络的技巧trick总结(图像识别/目标检测/语义分割)

本文总结了卷积神经网络(CNN)在图像识别、目标检测和语义分割任务中的优化技巧,包括预处理策略、参数初始化、训练过程的优化,如批量训练、学习率调整、模型结构改进等,还探讨了这些技巧在迁移学习中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CNN图像分类的tricks

原文

Baseline:

预处理:

  1. 随机抽取一张图片,解码成32位浮点型的[0,255]的像素值形式

  2. 随机在原图上裁剪一片比例在[3/4, 4/3],面积在[8%, 100%]的矩形区域,然后resize到224x224

  3. 按0.5的概率对上一步的图片水平翻转

  4. 在[0.6, 1.4]之间均匀采样系数用于缩放色调、饱和度和亮度(HSB)

  5. 按正态分布N(0, 0.1)采样系数,用于添加一个PCA噪声

  6. 在图片的RGB通道上分别减去123.68,116.779,103.939然后除以58.393,57.12,57.375进行归一化。

验证:
  保持验证图片的比例不变,将短边缩放到256,然后在其正中裁剪一块224x224的区域,并按和预处理中一样进行归一化。

参数初始化:

  卷积层和全连接层的参数都是用Xavier算法初始化,使用中会将参数在[-a,a]之间均匀随机选取,a又由输入输出通道数决定a=sqrt(6/(in_channels+out_channels))。所有的bias都初始化为0。BN层的γ初始化为全1向量,β初始化为全0向量。

训练过程:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值