-
在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上每个像素点在原始图像上映射的区域大小,这里的原始图像是指网络的输入图像,是经过预处理(如resize,warp,crop)后的图像。
-
神经元之所以无法对原始图像的所有信息进行感知,是因为在卷积神经网络中普遍使用卷积层和pooling层,在层与层之间均为局部连接。
-
神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;相反,值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次.
感受野的计算
如图所示的原始图像,经过kernel_size=3, stride=2的Conv1,kernel_size=2, stride=1的Conv2后,输出特征图大小为,很明显,原始图像的每个单元的感受野的值为1,Conv1的每个单元的感受野的值为3,而由于Conv2的每个单元都是由范围的Conv1构成,因此回溯到原始图像,每个单元能够看到大小的区域范围。

公式:

3=1+(3-1)*1
5=3+(2-1) *2
stride 2=1*2
本文深入探讨了卷积神经网络(CNN)中感受野的概念,解释了其如何影响神经元对原始图像信息的感知,并通过具体示例计算了不同层的感受野大小,揭示了其与特征抽象层次的关系。
1771

被折叠的 条评论
为什么被折叠?



