【YOLO改进】换遍IoU损失函数之GIoU Loss(基于MMYOLO)

GIoU损失函数

论文链接:https://arxiv.org/pdf/1902.09630

GIoU(Generalized Intersection over Union)损失函数是一种用于改善目标检测模型中边界框回归的方法。它是基于传统的IoU(交并比)损失的一个改进版本,解决了IoU在某些情况下无法提供有效梯度的问题,特别是当两个边界框不重叠时。

IoU损失的局限性

IoU是评估两个边界框重叠程度的一种标准度量方法,定义为两个边界框交集与并集的比例。然而,IoU损失有一个明显的缺点:当两个边界框没有任何重叠时,IoU为0,此时无法提供有关如何调整边界框以改善预测的梯度信息。

GIoU损失的定义

GIoU损失通过引入一个额外的度量来解决这个问题,即最小封闭框(minimum enclosing box)的概念。GIoU的计算不仅考虑了交集和并集,还包括了两个框之间的空间关系。

计算步骤如下:

  1. 计算IoU:首先,计算两个边界框A和B的交集与并集的比例,即IoU。
  2. 确定最小封闭框:找到能同时包含A和B的最小边界框C。
  3. 计算正则项:计算最小封闭框C与并集U之间的区域差异,并用这个差异来调整IoU值。

公式表示为:

\text{IoU} = \frac{\text{Area of Intersection}}{\text{Area of Union}}

\text{GIoU} = \text{IoU} - \frac{\text{Area of the smallest enclosing box} - \text{Area of Union}}{\text{Area of the smallest enclosing box}}

替换GIoU损失函数(基于MMYOLO)

由于MMYOLO中已经实现了GIoU Loss的计算,所以我们想使用GIoU损失函数替换CIoU损失函数只需要修改配置文件即可:

        # 修改此处实现IoU损失函数的替换
        loss_bbox=dict(
            type='IoULoss',
            iou_mode='giou',
            bbox_format='xywh',
            eps=1e-7,
            reduction='mean',
            loss_weight=loss_bbox_weight * (3 / num_det_layers),
            return_iou=True),

修改后的配置文件(以configs/yolov5/yolov5_s-v61_syncbn_8xb16-300e_coco.py为例)

_base_ = ['../_base_/default_runtime.py', '../_base_/det_p5_tta.py']

# ========================Frequently modified parameters======================
# -----data related-----
data_root = 'data/coco/'  # Root path of data
# Path of train annotation file
train_ann_fil
### YOLOv11 改进策略:Focaler-IoU 及其变种在边界框回归中的应用 YOLOv11 的改进策略中,引入了 Focaler-IoU 系列损失函数以优化边界框回归性能。这些损失函数通过结合几何关系和样本分布特性,显著提升了检测器对简单样本和困难样本的适应能力[^3]。 #### 一、Focaler-IoU 设计原理 Focaler-IoU 是一种改进型的 IoU 损失函数,其核心思想是通过对不同难度的样本施加不同的权重,从而更聚焦于困难样本或简单样本的回归。具体而言,Focaler-IoU 在传统 IoU 损失的基础上加入了动态调整因子,使得模型能够更好地处理样本不平衡问题[^2]。 #### 二、Focaler-IoU 的优势 1. **动态权重调整**:Focaler-IoU 能够根据样本的难易程度自动调整损失权重,从而提高模型对困难样本的关注度[^3]。 2. **几何关系建模**:通过引入边界框之间的几何关系(如重叠面积、中心点距离等),Focaler-IoU 提供了更精确的回归指导[^1]。 3. **泛化性**:Focaler-IoU 及其变种(如 Focaler-DIoU、Focaler-GIoU 和 Focaler-CIoU)适用于多种检测任务,并能有效提升检测精度[^2]。 #### 三、Focaler-IoU 变种及其特点 以下是 Focaler-IoU 的几种变种及其在边界框回归中的应用: 1. **Focaler-DIoU** Focaler-DIoU 在 DIoU(Distance IoU)的基础上加入了动态权重调整机制。DIoU 不仅考虑了边界框的重叠区域,还引入了中心点距离作为惩罚项。Focaler-DIoU 进一步增强了对困难样本的关注,从而提高了边界框回归的准确性[^1]。 2. **Focaler-GIoU** Focaler-GIoU 基于 GIoU(Generalized IoU)设计,除了计算重叠区域外,还考虑了包含两个边界框的最小闭包区域。这种设计有助于减少预测框超出目标范围的情况,而 Focaler-GIoU 则通过动态权重进一步优化了这一过程[^1]。 3. **Focaler-CIoU** Focaler-CIoU 是 CIoU(Complete IoU)的改进版本,综合了重叠区域、中心点距离和宽高比例三个因素。它能够提供更加全面的回归指导,尤其适合处理形状差异较大的目标。Focaler-CIoU 通过动态权重调整,进一步提升了模型对复杂场景的适应能力[^1]。 #### 四、实现代码示例 以下是 Focaler-CIoU 的实现代码示例: ```python import torch def focaler_ciou_loss(pred_boxes, target_boxes, alpha=1.0, beta=1.0): # 计算CIoU损失 def compute_ciou(pred, target): eps = 1e-7 # 获取边界框的坐标 x1p, y1p, x2p, y2p = pred.unbind(-1) x1g, y1g, x2g, y2g = target.unbind(-1) # 计算交集区域 w_intersect = (torch.min(x2p, x2g) - torch.max(x1p, x1g)).clamp(0) h_intersect = (torch.min(y2p, y2g) - torch.max(y1p, y1g)).clamp(0) area_intersect = w_intersect * h_intersect # 计算并集区域 area_pred = (x2p - x1p) * (y2p - y1p) area_target = (x2g - x1g) * (y2g - y1g) area_union = area_pred + area_target - area_intersect + eps # 计算IoU iou = area_intersect / area_union # 计算中心点距离 center_p = torch.stack([(x1p + x2p) / 2, (y1p + y2p) / 2], dim=-1) center_g = torch.stack([(x1g + x2g) / 2, (y1g + y2g) / 2], dim=-1) dist_center = torch.sum((center_p - center_g) ** 2, dim=-1) # 计算最小闭包区域 c_w = torch.max(x2p, x2g) - torch.min(x1p, x1g) c_h = torch.max(y2p, y2g) - torch.min(y1p, y1g) c_diag = c_w ** 2 + c_h ** 2 + eps # 计算宽高比例差异 v = (4 / math.pi ** 2) * torch.pow( torch.atan(w_pred / h_pred) - torch.atan(w_gt / h_gt), 2 ) with torch.no_grad(): alpha_ciou = v / (1 - iou + v + eps) # 计算CIoU ciou = iou - (dist_center / c_diag) - (alpha_ciou * v) return 1 - ciou # 应用动态权重调整 loss = compute_ciou(pred_boxes, target_boxes) focal_weight = (1 - iou) ** alpha * (beta + loss) ** beta return (focal_weight * loss).mean() ``` #### 五、总结 通过引入 Focaler-IoU 系列损失函数YOLOv11 在边界框回归方面取得了显著的性能提升。这些损失函数不仅关注几何关系,还通过动态权重调整机制解决了样本不平衡问题,从而提高了模型在复杂场景下的检测精度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值