Speed/accuracy trade-offs for modern convolutional object detectors

本文通过对比SSD、R-FCN与Faster R-CNN在速度与精度上的权衡,分析了不同特征提取器的效果以及目标大小、图像分辨率、建议框数量等因素对检测性能的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Speed/accuracytrade-offs for modern convolutional object detectors

 

1:Accurancy VS time


从上图可以看出SSD,R-FCN在速度上要远远超过Faster R-CNN,但是在精度上Faster R-CNN领先,R-FCN紧随其后。但是Faster R-CNN可以通过设置region proposal来降低处理速度,如Faster R-CNN w/ResNet 50 poposal。可以参考下表:


速度选择:SSD,R-FCN,Faster R-CNN w/Resnet 101

精度选择:Faster R-CNN

2:The effect of thefeature extractor


从上图可以看出,Faster R-CNN与R-FCN对于特征提取器的效果比较敏感,SSD则没有什么大的影响。

特征提取器敏感:Faster R-CNN,R-FCN

特征提取器不敏感:SSD

3:The effect ofobject size


从上图可以看出,三种基础架构对于大目标检测准确率均比较高,总体来说SSD在大目标检测上表现的比较好,但是在小目标检测上均比较低,SSD最低。

大目标:首选SSD。Faster R-CNN也可以。

小目标:Faster R-CNN,R-FCN

4:The effect ofimage size


此图比较了分辨率对于检测器的影响,从上图可以看出,图像分辨率增大后,Faster R-CNN与R-FCN检测率均提高,而SSD没有太大改变。结合Fig4,说明了增大图片分辨率对于SSD架构来说,小目标检测还是很差。至于R-FCNFaster R-CNN增大图片分辨率大目标与小目标检测率均提高,还没看出来!但是作者看出来了!

5:The effect of thenumber of proposals


从上图(a)可以看出,当proposal 设置为10的时候mAP离最高的mAP:35也相差了不到5个点(proposal=300),最佳的是在proposal=50的情况。图(b)也表现出了同样的trade-off。

6:FLOPs analysis




从图7再次印证了SSD的处理速度要比其它两个架构的快很多。从图8看出当FLOPs对等的情况下Inception与MobilNet这两种特征提取器处理速度要远比其它提取器要高。

7:Memory analysis




从图9图10可以看出,MobileNet架构与Inception架构相比较其它几个,同等条件下需要的内存较少,尤其是MobileNet架构。

 

8: Good localization at .75 IOU means good localization at all IOUthresholds


从图11看出,当检测器在较大的IOU(.75)上表现出较差的性能的时候,往往在小的IOU(.5)上表现出同样的性能。这两个IOU较好的拟合了IOU在0.5~0.95上的情况,并且在IOU=0.75的时候曲线表现的稍微紧凑些。

 

剩余的就是作者给出了部分模型比较结果,就不再这里写了!

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值