——NeoZng[neozng1@hnu.edu.cn]
不小心又咕咕咕了,寒假保证一周两更!
-
FL(focal loss)
在介绍交叉熵损失的时候我们知道虽然它改善了输出层梯度消失的问题,却无法赋予不同的样本以不同的损失权重。这个问题在one-stage检测器中尤为严重,如前文的基本概念中介绍的那样,目标检测的正负样本严重失衡,存在大量的背景(负类),而有目标存在的正样本区域则是少之又少。two-stage检测器如Faster R-CNN等可以在区域提议阶段之后对正负样本进行筛选使他们的比例保持在1:3左右(经验值),而one-stage由于没有类似RPN的结构因此无法调整正负样本的比例。
并且,负样本又常为易分样本(背景的提取出来的特征和目标特征通常差异很大),正样本由于数量特别少而无法主导损失和梯度,因此模型会往我们不期望的方向发展。在得到MSE的启发后,自然而然,我们需要为此设计一种损失函数,能够提高正样本和难样本的权重,降低简单样本对损失的贡献从而修正这个问题。
Focal Loss将损失函数设计成如下的样子:

令:

得到统一
Focal Loss详解

本文深入探讨Focal Loss解决目标检测中正负样本失衡问题的方法,解析其如何提高难样本权重,对比Cross Entropy损失,并引入GHM进一步优化梯度分布。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



