一、简介
目标检测R-CNN与Fast R-CNN没能摆脱传统候选区域算法Selective Search的限制。Selective Search算法进行候选区域的确定正是导致这些算法耗时,从而无法实现实时检测的主要原因。为了解决候选区域提取这一个瓶颈,任少卿等人在2016年提出了Faster R-CNN,论文名字”Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”。
Faster R-CNN主要包括两个模块:
1)一个是深度全卷积网络RPN,该网络用来产生候选区域;
2)另一个是Fast R-CNN检测器,使用RPN网络产生的候选区域进行分类与边框回归计算。
整个系统共享卷积特征图,即此特征图既作为RPN网络的输入也作为Fast R-CNN的输入,是一个统一的用来进行物体检测的网络,如下图所示。可以简单理解Faster R-CNN为RPN和Fast R-CNN的结合,通过RPN代替Selective Search提取候选区域,加快了运行速度。
二、RPN网络
一个RPN网络的输入是任意一张图片,输出是一系列矩形object proposal,每一个object proposal带着一个评分值objectness score。我们用一个全卷积网络对这一个过程进行建模。
使用3*3的filter对feature map进行卷积,目的是使提取出来的feature更鲁棒。注意:CNN提取出来的feature map在这里是对每一张image的每一个像素点来说都是256-dimension的,因为CNN最后一层使用了256个filter。一个完整的RPN网络如下图所示。
Faster RCNN中anchor的取值为9个矩形,9个矩形共有3种形状,长宽比为大约为三种(1:1,1:2,2:1)。实际上通过anchors就引入了检测中常用到的多尺度方法。
参考文章:
【1】https://blog.youkuaiyun.com/fengbingchun/article/details/87195597
【2】https://zhuanlan.zhihu.com/p/59186710