一、概念
感受野是指特征图上的某个点能看到的输入图像的区域,即特征图上的点是由输入图像中感受野大小的区域经过计算得到的。
二、示意图
图2-1所示为一个三层卷积网络,每一层的卷积核大小为3×33×33×3,步长为111。

- 第一层感受野大小

如图2-2所示,第一层特征图中的一个点对应输入图像的区域大小为3×33×33×3,因此第一层特征图的感受野大小为3×33×33×3。
- 第二层感受野大小

如图2-3所示,第二层特征图中的一个点对应输入图像的区域大小为5×55×55×5,因此第二层特征图的感受野大小为5×55×55×5。
- 第三层感受野大小

如图2-4所示,第三层特征图中的一个点对应输入图像的区域大小为7×77×77×7,因此第二层特征图的感受野大小为7×77×77×7。
三、计算公式
卷积层和池化层都会影响感受野,而激活函数层通常对感受野没有影响。对于一般的卷积神经网络,感受野可由式(3-1)和式(3-2)计算得出。
RFl+1=RFl+(k−1)×Sl(3-1)RF_{l+1}=RF_{l}+\left ( k-1 \right )\times S_{l} \tag{3-1}RFl+1=RFl+(k−1)×Sl(3-1)
Sl=∏i=1lStridei(3-2)S_{l}=\prod_{i=1}^{l}Stride_{i} \tag{3-2}Sl=i=1∏lStridei(3-2)
其中,RFl+1RF_{l+1}RFl+1与RFlRF_{l}RFl分别代表第l+1l+1l+1层与第lll层的感受野,kkk代表第l+1l+1l+1层卷积核的大小,SlS_{l}Sl代表前lll层的步长之积。注意,当前层的步长并不影响当前层的感受野。
四、有效感受野
通过式(3-1)和式(3-2)求取出的感受野通常很大,而实际的有效感受野往往小于理论感受野。
从图2-4中可以看出,虽然第三层的感受野是7×77×77×7,但是输入层中边缘点的使用次数明显比中间点要少,因此做出的贡献不同。
经过多层的卷积堆叠之后,输入层对于特征图点做出的贡献分布呈高斯分布形状。
感受野是指特征图上每个点能看到的输入图像区域,随着网络层数增加,感受野会变大。计算公式涉及卷积核大小和步长。实际的有效感受野往往小于理论值,呈高斯分布形状。
2327

被折叠的 条评论
为什么被折叠?



