来源:
从卷积框得到的灵感,若某层特征图大小为51x39x256(256是层数:H,W,C), 通过一个3x3的滑动窗口,在这个51x39的区域上进行滑动,stride=1,padding=1,这样一来,滑动得到的就是51x39个3x3的窗口。
经验:
此时,我们可以通过卷积框的中心点得到原始图片的中心点。此时我们假设,每个3*3的窗口,都是由原图经过 spp 池化得到的。
且该窗口来自于9种不同区域的池化(但是这些池化在原始图片中心点都一样)。如此一来,在每个窗口位置,我们都可以根据9个不同长宽比例、不同面积的anchor,逆向推导出它所对应的原始图片中的一个区域,这个区域的尺寸以及坐标,都是已知的。而这个区域,就是我们想要的 proposal。所以我们通过滑动窗口和anchor,成功得到了 51x39x9 个原始图片的proposal。