参考博客:https://blog.youkuaiyun.com/auto1993/article/details/78514071
为什么需要RoI Pooling?
答:在FAST R-CNN中,特征被共享卷积层一次性提取,因此对于每个roi而言,需要从共享卷积层上摘取对应的特征,并且送入全连接层进行分类。因此,ROI Pooling做2件事
task 1: 为每个roi选取对应的特征,
task 2: 满足全连接层的输入需求,将每个roi对应的特征的维度转化为某个定值,
具体操作如下:
1.根据输入image, 将ROI映射到feature map对应位置;
2. 将映射后的区域划分成相同大小的settions(这个的具体值由后面的全连接层决定)
3. 对每个sections进行max pooling操作
例子:
假设我们有一个8x8的feature map, 一个ROI=[0,3,7,8],以及FPN要求的输出维度为mxn=2*2
step 1: 将其划分为mxm=2x2=4个sections,
注意:这个例子中region proposal 即roi是5x7大小的,在pooli