VGG论文学习心得

本文详细探讨了VGG网络的结构,包括卷积层、池化层和全连接层的设计,以及VGG16和VGG19的差异。在训练参数方面,介绍了批大小、动量、正则化、dropout和学习率策略。通过多尺度训练和池化策略,确保模型能够适应不同分辨率的图像。实验结果显示,网络层数增加能降低错误率,而模型集成如多尺度评估和裁剪方法能进一步提升性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、网络结构

基本概念

如果输入的是一个RGB图像,那么就会有3个通道。“channel”通常被用来描述“layer”的结构。相似的,“kernel”是被用来描述“filter”的结构。

来自 <深度学习中的各种卷积_滤波器>

输入是一个5x5x3的矩阵,有三个通道。filter是一个3x3x3的矩阵。首先,filter中的每个卷积核分别应用于输入层中的三个通道。执行三次卷积,产生3个3x3的通道。

然后,这三个通道相加(矩阵加法),得到一个3x3x1的单通道。这个通道就是在输入层(5x5x3矩阵)应用filter(3x3x3矩阵)的结果。

卷积神经网络大小固定在224*224RGB大小,并对其进行预处理:average(图像像素数据-RGB值),将图片放在卷积神经网络(3*3)里面进行计算,池化是2*2 步长为2,卷积的步长为1

</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值