什么是感受野(Receptive Field)?
感受野(Receptive Field)是卷积神经网络(CNN)中的一个重要概念,它描述了网络中某个神经元(或特征图中的一个像素)能够“看到”或“感知”到的输入图像的区域大小。简单来说,感受野定义了该神经元对其输入数据的影响范围。
直观理解
在卷积神经网络中,输入图像通过多层卷积和池化操作被逐步处理。每一层的神经元并不是直接处理整个图像,而是通过卷积核(滤波器)在图像的局部区域内进行计算。随着网络层数的增加,神经元能够感知的区域逐渐变大:
- 在浅层网络中,神经元只能感知输入图像的一个小区域,比如边缘或纹理等局部特征。
- 在深层网络中,由于多层卷积和池化的累积效应,神经元能“看到”更大的区域,甚至覆盖整个图像,提取高层语义信息(如物体的整体形状)。
感受野的计算
感受野的大小会随着网络结构的变化而改变,影响它的主要因素包括: