【目标检测】损失函数：不同损失函数概念及其代码实现

最新推荐文章于 2024-10-10 15:27:42 发布

初初初夏_

最新推荐文章于 2024-10-10 15:27:42 发布

阅读量4.7k

点赞数 58

CC 4.0 BY-SA版权

分类专栏：目标检测文章标签：目标检测损失函数

本文链接：https://blog.youkuaiyun.com/qq_43676259/article/details/135644084

本篇文章介绍目标检测中不同的损失函数概念及其代码实现。目标检测主要任务为实现目标的分类与定位，其损失组成如下：

类别/置信度损失（分类任务）：BCE，FL，QFL，VFL

位置损失（回归任务)：IoU，GIoU，DIoU，CIoU，DFL(分类)

类别/置信度损失

BCE

二值交叉熵(Binary Cross-Entropy, BCE)是一种应用于二分类任务中的损失函数，用于衡量目标类别预测值和实际值之间的差距，其计算公式如下：
${BCE}(y,p) = - y\log (p) - (1 - y)\log (1 - p)$
其中 $y$ 表示目标的实际类别，值为0或1， $p$ 为目标的预测类别，值为[0，1]，进一步地，BCE Loss可表示为以下形式：
${BCE}(p_t) = - log (p_t)$
$p_t= \begin{cases} p，y=1 \\ 1-p，otherwise\ \end{cases}$
针对多类别任务，可通过独热编码将其分解为多个二分类任务的组合再使用BCE Loss。
BCE在PyTorch中的实现如下所示：

'''
函数实现:
	binary_cross_entropy_with_logits:Sigmoid + BCE
	binary_cross_entropy: BCE
'''
torch.nn.functional.binary_cross_entropy_with_logits(
						input=None,  # 预测值
						target=None,  # 实际标签
						weight=None,  # 对每个样本的损失进行加权
						size_average=None,  # 已弃用
						reduce=None,       # 不使用
						pos_weight=None,  # 正样本的损失加权(长度等于类数)
						reduction='mean'  # 所有样本的损失求平均(mean)或求和(sum)
						)
'''
类实现(调用上面的函数实现损失计算)
'''
torch.nn.BCEWithLogitsLoss(weight,pos_weight,reduction)

Focal Loss

Focal Loss(FL)由文章Focal Loss for Dense Object Detection提出。Focal Loss在BCE Loss的基础上，通过权重系数实现以下两点目的：

解决正负样本不平衡问题：目标检测任务中存在大量的背景(负样本)，实际目标(正样本)占比减少
${BCE}(p_t) = - α_tlog (p_t)$
$α_t= \begin{cases} α，y=1 \\ 1-α，otherwise\ \end{cases}$
其中 $α$ 用于控制正负样本的权重。
降低易分类样本的权重：使模型训练更加关注于困难样本
${FL}(p_t) = -(1-p_t)^γlog (p_t)$
其中 $γ$ 用于控制难易分类样本的权重， $p_t$ 越大，则该样本越易分类，则对损失的贡献越小。
结合以上两点，得到最终的Focal Loss公式如下：
${FL}(p_t) = -α_t(1-p_t)^γlog (p_t)$