图像分类篇:pytorch实现VGG

一、VGG网络详解及感受野计算

VGG在2014年由牛津大学著名研究组VGG(Visual Geometry Group)提出,斩获该年ImageNet竞赛中Localization Task(定位任务)第一名和Classification Task(分类任务)第二名。VGG有两种结构,分别是VGG16和VGG19,两者并没有本质上的区别,只是网络深度不一样。

VGG网络的创新点:通过堆叠多个小卷积核来代替大尺度卷积核,可以减少训练参数,同时能保证相同的感受野。

1.CNN感受野

在卷积神经网络中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野(receptive field),通俗的解释是,输出feature map上的一个单元对应输入层的区域大小。

  以上图为例,输出层layer3中一个单元对应输入层layer2上区域大小为2x2(池化操作),对应输入层layer1上大小为5x5,可以理解为,layer2中2x2区域中的每一块对应一个3x3的卷积核,又因为stride=2,所以layer1的感受野为5x5.

感受野的计算公式为:

F(i)=(F(i+1)-1)*Stride +Ksize

  •  F(i)为第i层感受野
  • Stride为第i层的步距
  • Ksize为卷积核或池化核尺寸

以上图为例:

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值