感受野(Receptive Field, RF)是卷积神经网络(CNN)中的一个重要概念,它指的是网络中某个特定神经元能够接收到的输入图像上的区域大小。换句话说,感受野定义了输出特征图中的每个单元依赖于输入图像中哪些像素。理解感受野对于设计和调试CNN架构非常重要,因为它直接影响模型捕捉到的上下文信息量。
感受野的计算
感受野的计算涉及多个因素,包括卷积核大小、步长(stride)、填充(padding),以及池化操作等。随着网络深度的增加,感受野会逐渐扩大,因为每一层都在其前一层的感受野基础上进行操作。
感受野的计算公式如下:
RFnew=RFold+(kernel size−1)×jumperold\text{RF}_{\text{new}} = \text{RF}_{\text{old}} + (\text{kernel size} - 1) \times \text{jumper}_{\text{old}}RFnew=RFold+(kernel size−1)×jumperold
其中:
- RFoldRF_{old}RFold 是前一层的感受野。
- kernelsizekernel sizekernelsize 是当前层的卷积核或池化核大小。
- jumperoldjumper_{old}jumperold<