论文地址
内容
- 经典的基于区域的检测器faster-rcnn,可以看成以ROI pooling为界的两个部分组成的网络: 一个部分是ROI pooling层之前的特征提取部分以及RPN候选框提取部分,该部分计算共享;另外一个部分是ROI之后,用于目标检测,该部分对于每个proposal框都需要进行一遍计算。后半部分由于是per-ROI的,所以比较费时。
- 另外关于ROI pooling插入的位置
- 越靠近输入,检测部分的网络就越深,检测的效果会越好,但是相应带来的坏处是费时
- 越远离输入,检测部分的网络就越浅,检测的效果相对会差一点,但是速度快。
- 在基于resnet的faster-rcnn中ROI pooling层是插在最后一个residual block前面的,以换到较好的检测结果。同时在卷积block前插入ROI pooling能够打破后面网络的平移不变性,使得后序网络对目标的位移会更敏感
- 基于前面内容,作者提出了一种全卷积网络,所有的计算基本上是共享的。并且讲检测部分网络的深度压缩到了0. 从下图可以看到,RFCN前101层全是一个共享的subnet,ROI-wise的子网络深度为0