经典卷积神经网络笔记-VGG16

本文详细介绍了VGG16网络结构,重点探讨了使用3*3小卷积核如何增加深度并提升性能。VGG16包含13个卷积层和3个全连接层,其设计原则是小卷积核、固定尺寸输入和逐步增加通道数。通过对比,解释了为何使用多个3*3卷积层优于大尺寸卷积层,并分析了参数量的减少。文章还讨论了网络配置和全连接层的参数计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

VGG16论文链接: https://arxiv.org/abs/1409.1556 收录于ICLR2015

网络结构和配置:

作者在这篇论文中主要探讨的是使用非常小的卷积核(3*3)来增加卷积神经网络的深度对于性能有很大的提升。如Table 1所示,作者设置了A-E五种卷积神经网络配置来探讨深度对于性能的影响。结构D和E就是我们熟知的VGG16(13个卷积层+3个全连接层)和VGG19(16个卷积层+3个全连接层)。PS:层数是没有包含maxpool的

这些网络都遵循一种通用的设计,输入到网络的是一个固定大小的224*224的RGB图像,所做的唯一预处理是从每个像素减去基于训练集的平均RGB值。图像通过一系列的卷积层时,全部使用3*3大小的卷积核。只有在配置C中,作者使用了1*1的卷积核,这可以被看作是输入通道的线性映射(接着是非线性)。卷积的步长均为1,padding也为1。每个网络配置都是5个最大池化层,最大池化的窗口大小为2*2,步长为2。

卷积层之后是三个完全连接(FC)层:前两层有4096个通道,第三个层执行的是1000路ILSVRC分类,因此包含1000个通道(每个类一个)。最后一层是softmax层。在A-E所有网络

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值