聊聊Focal Loss及其反向传播

最新推荐文章于 2025-06-22 09:55:10 发布

Zziven

最新推荐文章于 2025-06-22 09:55:10 发布

阅读量6.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习目标检测文章标签： Focal Loss 类别数据不均衡 OHEM

本文链接：https://blog.youkuaiyun.com/disen10/article/details/79289461

本文探讨了Focal Loss在解决目标检测中类别数据不均衡问题的应用，对比了与OHEM的区别，并详细解析了Focal Loss的原理和反向传播过程，展示其在one-stage detector如RetinaNet中的实验效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Focal Loss: Focal Loss for Dense Object Detection 论文链接：https://arxiv.org/abs/1708.02002

我们都知道，当前的目标检测（Objece Detection)算法主要分为两大类：two-stage detector和one-stage detector。two-stage detector主要包括rcnn、fast-rcnn、faster-rcnn和rfcn等，one-stage detector主要包括yolo和ssd等，前者精度高但检测速度较慢，后者精度低些但速度很快。

对于two-stage detector而言，通常先由RPN生成proposals，再由RCNN对proposals进行Classifcation和Bounding Box Regression。这样做的一个好处是有利于样本和模型之间的feature alignment，从而使Classification和Bounding Box Regression更容易些；此外，RPN和RCNN中存在正负样本不均衡的问题，RPN直接限制正负样本的比例为1:1，对于固定的rpn_batch_size，正样本不足的情况下才用负样本来填充，RCNN则是直接限制了正负样本的比例为1:3或者采用OHEM。

对于one-stage detector而言，样本和模型之间的feature alignment只能通过reception field来实现，且直接通过回归方式进行预测，存在这严重的正负样本数据不均衡（1:1000）的问题，负样本的比例过高，占据了loss的绝大部分，且大多数是容易分类的，这使得模型