【目标检测】RFBNet:Receptive Field Block Net for Accurate and Fast Object Detection(CVPR2017)

论文:《Receptive Field Block Net for Accurate and Fast Object Detection》

论文链接:https://arxiv.org/abs/1711.07767

参考原文:https://blog.youkuaiyun.com/u014380165/article/details/81556769

                  http://www.sohu.com/a/300330661_787107

代码链接:https://github.com/ruinmessi/RFBNet

 

1、绪论部分:

当前顶级目标检测器依赖于非常深的CNN主干网络,例如ResNet-101和Inception,优点是它们具有强大的特征表现能力,但是耗时严重。相反地,一些基于轻量级模型的检测器满足实时处理,但是精度是诟病。

在RFBNet这篇论文中,主要想利用一些技巧使用轻量级模型达到速度和精度并举的检测器。灵感来自人类视觉的感受野结构Receptive Fields (RFs) ,提出了新奇的RF block(RFB)模块,来验证感受野尺寸和方向性的对提高有鉴别鲁棒特征的关系。RFBNet是以主干网络(backbone)为VGG16的SSD来构建的。下面是讨论其有效性,两项基准测试实验和结果显示。RFBNet具备同非常深的主干网络检测器的精度,但是保持了实时性。

2、RFB结构

RFB是一个类似Inception模块的多分支卷积模块,它的内部结构可分为两个组件:多分支卷积层以及随后的膨胀卷积层,如下图(Figure2)所示:

RFB结构主要有两个特点

1、不同尺寸卷积核的卷积层构成的多分枝结构,这部分可以参考Inception结构。在Figure2的RFB结构中也用不同大小的圆形表示不同尺寸卷积核的卷积层。

2、引入了dilated卷积层,dilated卷积层之前应用在分割算法Deeplab中,主要作用也是增加感受野,和deformable卷积有异曲同工之处。

在Figure2的RFB结构中用不同rate表示dilated卷积层的参数。

在RFB结构中最后会将不同尺寸和rate的卷积层输出进行concat,达到融合不同特征的目的。在Figure2的RFB结构中用3种不同大小和颜色的输出叠加来展示。在Figure2的最后一列中将融合后的特征与人类视觉感受野做对比,从图可以看出是非常接近的,这也是这篇文章的出发点,换句话说就是模拟人类视觉的感受野进行RFB结构的设计。

RFB结构示意图如下所示:

è¿éåå¾çæè¿°

(a)是RFB,整体结构上借鉴了Inception的思想,主要不同点在于引入3个dilated卷积层(比如3*3conv, rate=1),这也是这篇文章增大感受野的主要方式之一。

(b)是RFB-s,RFB-s和RFB相比主要有两个改进,一方面用3*3卷积层代替5*5卷积层,另一方面用1*3和3*1卷积层代替3*3卷积层,主要目的应该是为了减少计算量,类似Inception后期版本对Inception结构的改进。

3、RFBNet检测结构

Figure5是RFB-Net300的整体结构示意图,基本上和SSD类似,和SSD不同的是:

1、主干网上用两个RFB结构替换原来新增的两层。

2、conv4_3和conv7_fc在接预测层之前分别接RFB-s和RFB结构,这两个结构的示意图如前面Figure4所示。

è¿éåå¾çæè¿°

4、实验结果

Table1是在PASCAL VOC2007 test-set数据集上的测试结果,训练集基于2007和2012的trainval。RFB Net300在mAP和FPS方面效果都不错。

è¿éåå¾çæè¿°

Table4是在COCO test-dev 2015数据集上的测试结果。最后一个RFB Net512-E主要做了2点改变:1、对conv7_fc的输出特征做了上up-sample,然后和conv4_3的输出特征做融合,基于融合后的特征做预测。这种做法其实是借鉴了FPN算法的思想。2、在RFB结构中增加了7*7大小的卷积分支。这两点改进对效果的提升有一定帮助,而且带来的计算量也少。
 

è¿éåå¾çæè¿°

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值