论文链接:https://arxiv.org/pdf/1605.06409v2.pdf
理解参考:http://blog.youkuaiyun.com/kekong0713/article/details/69919093
https://blog.youkuaiyun.com/tuzixini/article/details/78754618
一、改进点
1、使用全卷积网络,没有全连接层。在Faster RCNN基础上,采用全卷积的ResNet-101网络。卷积层为全部ROI共享。
R-CNN、Faster R-CNN和RFCN都是基于ROI的two stage检测算法,首先是基于算法(传统算法或者RPN)提取ROI,第二步是对每个ROI做分类和回归。三者不同的是,R-CNN中每个ROI没有共享的卷积层,对每个ROI都需要跑一遍网络,Faster R-CNN中先用基网络(例如ResNet的直到res4模块)提取特征,对每个ROI使用一个子网络(如res5模块)进行分类和回归。RFCN则不同,使用全部卷积提取特征,基网络的所有卷积层为每个ROI共享,并且每个ROI后面没有子网络进行回归和分类,这样减少了网络计算量,加快了训练及测试时间。
2、所有ROI在基网络得到的feature map上直接做分类和回归,但是深度学习分类模型高层特征对图像中目标变换具有鲁棒形,即对目标位置和大小变换不敏感,这种特性不适用于目标检测任务。文中引入position sensitive score map,即学习不同位置的特征,在网络学习的时候引入位置信息。在ROI Pooling的时候,某一位置的bin只在对应位置的score map上进行mean pooling。
二、总结
RFCN是在Faster R-CNN基础上做的改进,检测效果比Faster R-CNN效果略好,推理速度更快。