文章目录
RoI Pooling和
RoI Align是两种常用的目标检测中的
RoI特征提取方法。它们的主要区别在于:
如何将不同大小的RoI对齐到固定大小的特征图上,并在这个过程中保留更多的空间信息。
如果你是做目标检测相关的项目,那么这个问题肯定是跑不了。尤其是RCNN系列,肯定跑不掉。所以搞清楚这里的辨析,显得非常重要。
一、RoI Pooling
RoI Pooling最早是在Fast R-CNN中提出的,它的基本思路是:
将一个个大小不同的RoI,变成一个固定大小的网格(比如7*7),然后在每个网格上进行最大池化,输出固定大小的特征图。
具体到操作过程如下:

RoI Pooling实质上是什么呢?
RoI层只是SPPnets中使用的空间金字塔池化层的特殊情况,其中只有一个金字塔层。
(The RoI layer is simply the special-case of the spatial pyram
RoI Pooling和RoI Align是目标检测中用于特征提取的方法。RoI Pooling通过最大池化操作,将RoI转换为固定大小的特征图,但可能造成信息损失。RoI Align采用双线性插值,提供更精确的对齐,保留更多空间信息,但计算量较大。两者之间的选择取决于应用场景和计算资源的需求。
订阅专栏 解锁全文
986

被折叠的 条评论
为什么被折叠?



