YoloF you only look one level feature 详解

YOLOF

摘要

文中讨论FPN成功在于分而治之而不是特征融合。文中从另一个角度解决这个问题,只使用一层的特征信息。文中有两个主要因素扩张encoder、统一匹配。且608x608的图片在2080TI能够达到60fps。

为什么要去FPN, 因为造成显存冗余、检测器复杂、以及 降低推理速度。 对比flops(浮点运算数量)FPN有134G 和 一维特征6G. 显存冗余明显。推理速度为13FPS和34FPS对比。 但是一维特征会导致精度低,研究发现精度低的原因在于最后一层输出尺度小、以及单层anchor小于多层anchor。

文中改进

  1. 解决输出尺度单一问题,使用扩张卷积将不同感受野的特征结合一起。 引入了扩张encoder结构。

         (图没有办法上传,清自行下载论文看图)

 

这类encoder结构分成了两个部分,projector以及残差block。

Projector 将预测层首先使用1x1卷积,降低channel 维度。然后接一个3x3卷积改进上下文语义。 这一部分和FPN非常相似。 集成4类膨胀3x3卷积残差block。生成不同感受野的输出特征。

  1. Positive Anchor不均衡问题,单尺度输出面临着positive Anchor不足的问题。 使得小尺度检测出现遗漏。对每
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值