感受野的理解

最新推荐文章于 2025-10-15 23:06:49 发布

原创最新推荐文章于 2025-10-15 23:06:49 发布 · 522 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#fasterrcnn

机器学习专栏收录该内容

1 篇文章

订阅专栏

感受野的理解

今天看何恺明的faster rcnn的论文中说“由于卷积层输出的特征图感受野比较大，所以采用3X3的sliding window”

感受野的定义

卷积神经网络每一层输出的特征图（feature map）上的像素点在原始图像上映射的区域大小

感受野的计算

对于CNN，可以采用从深层到浅层逐层计算的方法
对于一个 $n$ 层网络，考虑它的第 $i$ 层( $i=1,...,n$ )，它是在第 $i-1$ 层的基础上通过大小为 $f_{i}$ 的卷积核，以及 $s_{i}$ 的stride卷积得到（不考虑padding)
则第 $i$ 层的每个像素点对应
第 $i-1$ 层的 $RF_{i,i-1}=f_{i}$ 个像素点
第 $i-2$ 层的 $RF_{i,i-2}=f_{i-1}+(RF_{i,i-1}-1)\times s_{i-1}$ 个像素点
第 $i-3$ 层的 $RF_{i,i-3}=f_{i-2}+(RF_{i,i-2}-1)\times s_{i-2}$ 个像素点
…
第0层的 $RF_{i}=f_{1}+(RF_{i,1}-1)\times s_{0}$ 个像素点
第0层代表原始图像