一、VGG网络详解及感受野计算
VGG在2014年由牛津大学著名研究组VGG(Visual Geometry Group)提出,斩获该年ImageNet竞赛中Localization Task(定位任务)第一名和Classification Task(分类任务)第二名。VGG有两种结构,分别是VGG16和VGG19,两者并没有本质上的区别,只是网络深度不一样。
VGG网络的创新点:通过堆叠多个小卷积核来代替大尺度卷积核,可以减少训练参数,同时能保证相同的感受野。
1.CNN感受野
在卷积神经网络中,决定某一层输出结果中一个元素所对应的输入层的区域大小,被称作感受野(receptive field),通俗的解释是,输出feature map上的一个单元对应输入层的区域大小。
以上图为例,输出层layer3中一个单元对应输入层layer2上区域大小为2x2(池化操作),对应输入层layer1上大小为5x5,可以理解为,layer2中2x2区域中的每一块对应一个3x3的卷积核,又因为stride=2,所以layer1的感受野为5x5.
感受野的计算公式为:
- F(i)为第i层感受野
- Stride为第i层的步距
- Ksize为卷积核或池化核尺寸
以上图为例:
<