VGG16理解

本文详细解析了VGG16的网络结构,包括其五部分卷积块和三部分全连接层的设计,展示了从输入图像到最终分类的全过程。通过分析卷积核数量、通道数变化和图像尺寸减小的过程,帮助读者理解VGG16如何实现特征提取和分类。

网络上能找到很多VGG的六种网络结构图,这六种结构分为A,A-LRN,B,C,D,E六种,D,E两种结构是常用的,这里使用了Rogn的图:
在这里插入图片描述
Rogn用绿色的部分指明了VGG16采用的结构,从这张图能看到,D中有5个卷积块,总共13层卷积层,最后接了3层全连接层,通过下图可以直观看到VGG16的网络结构:
在这里插入图片描述在上图中,红色为最大池化层,黑色为卷积层+ReLU层,蓝色为全连接层和ReLU层,棕色为softmax层,根据类别得分,对图片进行分类。
刚才提到,有5个卷积块,可以看到,每一个卷积块后都接着一个最大池化层,最大池化层的作用是缩小图片的尺寸。

  1. 输入的图像是224 * 224 * 3,即通道数为3
  2. block1:输入图像后,接上2个卷积层,每个卷积层64个卷积核,通道数为64
  3. 最大池化层:将特征图尺寸缩小到112,通道数翻一倍,变为128
  4. block2:包含2个卷积层,每个卷积层128个卷积核,128个通道
  5. block3:包含3个卷积层,每个卷积层256个卷积核,256个通道
  6. block4:包含3个卷积层,每个卷积层512个通道
  7. block5:包含3个卷积层,每个卷积层512个通道
  8. fc1:第一个全连接层,设置4096个神经元
  9. fc2:设置4096个神经元
  10. fc3:1000个神经元
    总体上,通道数不断增加,图像尺寸不断减小。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值