在之前的文章中介绍卷积算法时,一直在强调一个地方,那就是卷积算法是——卷积核在输入图像上滑动扫描的过程。
在每一次扫描时,可以把卷积核的在长宽方向的大小看做一个窗口,透过窗口可以看到的输入图像的范围,就称为感受野。
也就是神经网络(卷积)在每一次扫描过程中覆盖到的图像视野,这个概念很好理解,但是有必要对这个概念再深入说明一下,因为感受野这一概念,和很多神经网络结构和特性都有着千丝万缕的关系。
1、再来感受一下卷积的计算过程

在上图中,感受野就是每次卷积核移动时,投影在图片的一个 3x3 的正方形范围,透过他,可以看到输出图像中的一个像素与输入图像中的哪些像素有关。
换句话说,它表示一个输出像素“看到”的输入图像中区域的大小,注意是从输出来看的。如果你将卷积操作比作窗户,那么感受野就是一个输出像素透过这个窗户可以看到的输入图片的范围。
上图中,第一个输出左上角的像素点12.0,透过3x3的矩阵看到的是输入图像左上角的3x3的像素矩阵;最后一个输出14.0,透过3x3的矩阵看到的是输入图像右下角的3x3的像素矩阵,这个3x3的像素矩阵就是这个卷积的感受野。
本文详细探讨了卷积神经网络中感受野的概念,解释了感受野如何影响神经网络对图像理解和特征提取。通过实例阐述了3x3卷积核如何形成与5x5卷积相同的效果,同时讨论了这种替换带来的参数减少和网络非线性增强的好处。
订阅专栏 解锁全文
1541

被折叠的 条评论
为什么被折叠?



