Abstract
最先进的物体检测网络依靠区域提议算法来推测物体的位置。SPPnet [1]和Fast R-CNN [2]等研究已经减少了这些检测网络的运行时间,使得区域提议计算成为一个瓶颈。在这项工作中,我们引入了一个区域提议网络(RPN),该网络与检测网络共享全图像卷积特征,从而使近乎成本的区域提议成为可能。 RPN是一个完全卷积网络,可以同时预测每个位置的对象边界和对象分数。 RPN经过端到端的训练,生成高质量的区域提案,由Fast R-CNN用于检测。我们将RPN和Fast R-CNN通过共享卷积特征进一步合并为一个单一的网络 —— 使用最近流行的具有“关注”机制的神经网络术语,RPN组件告诉统一网络在哪里寻找(目标)。对于非常深的VGG-16模型[3],我们的检测系统在GPU上的帧速率为5fps(包括所有步骤),同时在PASCAL VOC 2007,2012上实现了最先进的目标检测精度, MS COCO数据集,每个图像只有300个提案。在ILSVRC和COCO 2015比赛中,更快的R-CNN和RPN是多条赛道中获得第一名的基础。代码已经公开。
索引术语 : 目标检测,区域建议,卷积神经网络。

Faster R-CNN是一种基于深度学习的目标检测框架,通过引入区域提议网络(RPN)解决了传统检测网络的运行效率问题。RPN与检测网络共享全图像卷积特征,实现快速的区域提议生成。该系统在保持高精度的同时,使用VGG-16模型在GPU上达到了5fps的检测速度,并在PASCAL VOC和MS COCO数据集上表现出顶级性能。此外,Faster R-CNN在ILSVRC和COCO 2015竞赛中占据主导地位,其相关代码已被开源。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



