论文阅读|一阶段的目标检测器EfficientDet

EfficientDet是2019年提出的一种优化的目标检测模型,旨在平衡精度和效率。通过引入加权双向特征金字塔网络(BiFPN)解决多尺度特征融合问题,以及采用复合缩放方法调整backbone、neck和head网络,实现可扩展的检测架构。BiFPN利用学习到的权重融合不同分辨率的特征,而复合缩放策略允许模型根据资源限制进行适配。EfficientDet家族在保持较低参数量和计算复杂度的同时,达到了State-of-the-Art的检测性能。

论文相关信息

1.论文题目:EfficientDet: Scalable and Efficient Object Detection

2.发表时间:201911

3.文献地址:https://arxiv.org/abs/1911.09070

4.论文源码:https://github.com/google/automl/tree/master/efficientdet

介绍

当前先进的模型大多聚焦于精度提高,但是其模型往往太大且计算量很大,使得模型无法部署到一些硬件条件较差的设备上,如机器人和无人车等。尽管已经有one-stage的anchor-free 的检测器能够提高模型的效率,但是往往这些都是通过牺牲精度换取效率,模型还都只是聚焦于某个特定的或很小范围的资源条件下的,无法适应不同资源条件的设备。

于是本文提出要构建一个具有高精度和高效率的可缩放的检测架构,能够适应一个较大范围的资源限制。论文系统的学习了检测器架构的各种设计选择,在评估骨干网、特征融合、以及head(class/box) network之后提出当前存在的两大挑战:

挑战1:高效的多尺度融合。 以往的特征融合网络结构如FPN、PANet、NAS-FPN等在融合不同的输入特征时,往往只是对这些特征图进行无差别地简单相加,然而不同的输入特征图有不同的分辨率,它们对最终融合的贡献也是不等的。因此,作者提出一种简单高效的weighted bi-directional feature pyramid network (BiFPN)(加权双向特征金字塔网络),该网络引入了可学习的权重来学习不同输入特征图的重要性,同时重复的应用自上而下和自下而上的多尺度特征融合 。

挑战2:模型的缩放。之前的网络通过更大的骨干网和更大的输入图片尺寸来获得更高的精度,而本文观察到通过缩放特征网络和头部预测网络对于精度和效率的提高也是很关键的,于是提出一种混合缩放方法(compound scaling)来缩放目标检测器,能够关联的缩放backbone、neck、head三部分网络的分辨率/深度/宽度。

最终,基于这些优化(BiFPN 和compound scaling)以及更好的backbone(EfficientNets),得到了一个新的one-stage目标检测器家族——EfficientDet,它能够适应不同的资源限制条件,在比较少的参数和浮点运算(FLOPs)条件下取得比以往检测器更高的检测精度。其中Efficient-D7在单个模型和单个测试尺度下,在COCO数据集上得到的SOTA的表现,且只有77M参数和410B FLOPs,可见下图。只要少许的修改,模型就能够应用到实例分割上且性能很好。
在这里插入图片描述

Related Work

One-Stage Detectors: 检测器根据是否有个步骤提出感兴趣区域可划分为two-stage和one-stage。two-stage往往精度更高,one-stage在基于预定

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值