目标检测 CVPR 2019 FCOS

FCOS是一种基于FPN的anchor-free目标检测算法,它克服了传统anchor-based方法的局限,如参数调整复杂、样本不平衡及计算量大等问题。通过简化模型,FCOS实现了更高效的检测过程,同时保持了高精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考:
1

  1. 这是一篇anchor-free的目标检测算法。
  2. 以往的anchor-based算法的缺点:
    缺点一:检测性能对于anchor的大小、数量、长宽比都非常敏感
    缺点二:固定的anchor损害检测器的普适性,导致对于不同任务,其anchor都必须重新设置大小和长宽比。
    缺点三:为匹配真实框,需生成大量anchor,但是大部分anchor在训练时标记为negative,就会造成样本间的不平衡,没有充分利用fore-ground。
    缺点四:训练中需要计算所有anchor框与真实框的iou,计算量大。消耗大量内存和时间。
  3. FCOS也是用了FPN的结构,FPN是feature pyramid networks特征金字塔网络,是一种常规利用CNN模型来高效提取图片中各维度特征的方法。FPN是一种多尺度目标检测算法,在它之前的目标检测算法都只采用顶层特征做预测,低层的特征语义信息比较少但是目标位置准确,高层特征语义信息丰富但是目标位置粗略。FPN独特的地方在于预测是在不同的特征层独立进行的。
  4. FCOS也是用了FPN结构,但是最后两层没有进行上采样。FPN结构在高层的语义特征融合效果并不好。所以构建FPN没有必要使用所有的卷积层。
  5. FCOS的优点在于:
    优点一:检测问题可以被统一到其他FCN-solvable的问题,如语义分割。可以简单重用其他任务的idea。
    优点二:由于anchor-free,所以不需要像anchor-based那样去调大量参数,并且还不用计算iou。
  6. 如下图所示:重叠区域的问题:
    在这里插入图片描述
    大部分的重叠区域的ground truth box之间的尺度变化非常大,例如图片中一个人和一个苹果,就很容易形成包含关系。基于FPN(特征金字塔网络)的多尺度检测可以有效减少这种情况的发生。
  7. 神经网络的浅层更多是细节特征,对于检测小目标有利。高层更多是语义特征,对于检测大目标有利。
  8. 如果出现重叠区域,按照两种情况采用两种解决办法:
    情况一:如果大尺度和小尺度重叠,例如图片中人和手中的苹果,使用FPN结构在每一层加以限定。可以采用这种方法是因为两者尺度差异很大。
    情况二:如果一个像素点在同一层落到了多个ground truth区域,这样也会产生模棱两可的情况,这时可以简单地采用使用最小区域来作为回归目标。
  9. 从anchor base的角度,FCOS通过两个IOU阈值将标定的anchor分为negatige ignored positive,这样并不能充分利用正样本。增大区域为了获得更多的正样本以更好的用于回归器中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值