小目标检测的新突破——归一化高斯Wasserstein Distance Loss

最新推荐文章于 2025-06-08 15:17:59 发布

编码实践

最新推荐文章于 2025-06-08 15:17:59 发布

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

文章标签：目标检测人工智能计算机视觉

本文链接：https://blog.youkuaiyun.com/wellcoder/article/details/130935550

计算机视觉进阶同时被 2 个专栏收录

90 篇文章 ¥99.90 ¥299.90

订阅专栏

计算机视觉

90 篇文章 ¥99.90 ¥299.90

订阅专栏

针对小目标检测的挑战，本文介绍了归一化高斯Wasserstein Distance Loss (N-GWDLoss)，一种能有效提升小目标检测精度的包围框相似度度量方法。N-GWDLoss不同于传统的L1、L2和IoU，能减小小目标与大目标检测性能差距。文章提供实现代码，便于在实际项目中应用。

小目标检测的新突破——归一化高斯Wasserstein Distance Loss

在目标检测领域，YOLOv7无疑是一个备受称赞的算法，它具有高速和高精度的优点，但是对于小目标检测，它在检测精度方面仍有改进空间。为了解决这个问题，我们提出了一种新的包围框相似度度量方法，即归一化高斯Wasserstein Distance Loss (N-GWDLoss)。

N-GWDLoss是针对小目标检测而设计的，它通过归一化高斯形式的Wasserstein距离来度量包围框之间的相似度。与传统的L1、L2和IoU度量不同，N-GWDLoss能够有效地缩小目标检测中小目标检测与大目标检测之间的性能差距。

下面我们来看一下具体实现：

import torch
import torch.nn.functional as F

class NormalizedGaussianWassersteinDistanceLoss(torch

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

编码实践

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

Yolov7/Yolov5损失函数改进：Wasserstein Distance Loss，助力小目标涨点

①答疑群聊服务；②YOLO大模型知识问答系统；③计算机视觉论文生成智能体；

03-15

6035

Yolov7/Yolov5损失函数改进：Wasserstein Distance Loss，助力小目标涨点

YOLOv10涨点改进：如何魔改注意力进行二次创新，高效替换PSA | NEU-DET为案列进行展开

①答疑群聊服务；②YOLO大模型知识问答系统；③计算机视觉论文生成智能体；

05-28

6751

在NEU-DET案列进行可行性验证，1）mAP50从0.683提升至0.698；2）mAP50从0.683提升至0.695;

参与评论您还未登录，请先登录后发表或查看评论

小目标检测

xys430381_1的专栏

04-05

1245

小目标检测文章总结 2018年小目标检测文章总结 小目标检测论文阅读 小目标检测：Improving Small Object Detection 快速小目标检测–Feature-Fused SSD: Fast Detection for Small Objects ...

YOLOv8改进：LOSS系列篇 | Wasserstein Distance Loss，助力小目标涨点

会AI的学姐

10-14

1058

基于Wasserstein距离的小目标检测评估方法，助力小目标检测

YOLOv9改进策略：loss优化 | Wasserstein Distance Loss，助力小目标涨点

①答疑群聊服务；②YOLO大模型知识问答系统；③计算机视觉论文生成智能体；

03-26

1957

Wasserstein Distance Loss | 亲测在多个数据集能够实现涨点，对小目标、遮挡物性能提升明显

芒果YOLOv8改进30：损失函数IoU篇之NWDLoss：即插即用｜YOLOv8小目标检测高效涨点2%，改进用于小目标检测的归一化高斯 Wasserstein Distance Loss，提升小目标

包括YOLOv5、YOLOv7、YOLOv8等模型改进

03-27

1万+

代码实践｜YOLOv8改进损失函数NWD Loss：独家更新｜即插即用｜YOLOv8小目标检测高效涨点，超参数合理调试

用于小目标检测的归一化高斯Wasserstein距离（NWD）之论文阅读

最新发布

qq_41627642的博客

06-08

933

检测小目标是一个非常具有挑战性的问题，因为小目标在图像中通常仅包含极少的像素。我们发现，当前最先进的检测器在小目标上的表现并不理想，主要原因在于小目标缺乏足够的外观信息。我们的一个关键观察是，像 IoU（交并比）及其扩展形式这样的评估指标，对小目标的位置偏移非常敏感，这种敏感性会在基于 anchor 的检测器中显著降低检测性能。为了解决这一问题，我们提出了一种用于小目标检测的新评估指标——Wasserstein 距离。

芒果YOLOv10改进26：损失函数IoU篇之NWDLoss：即插即用｜YOLOv10小目标检测高效涨点2%，改进用于小目标检测的归一化高斯Wasserstein Distance Loss提升小目标

包括YOLOv5、YOLOv7、YOLOv8等模型改进

06-09

491

YOLOv10改进：损失函数IoU篇之NWDLoss：即插即用｜YOLOv8小目标检测高效涨点2%，改进用于小目标检测的归一化高斯Wasserstein Distance Loss，提升小目标

【YOLOv8改进损失函数】基于Wasserstein Distance Loss的小目标检测评估方法（含源代码）

wzk4869的博客

03-17

1439

【YOLOv8改进损失函数】基于Wasserstein Distance Loss的小目标检测评估方法（含源代码）

YOLOv7损失函数改进：Wasserstein Distance Loss，助力小目标涨点

①答疑群聊服务；②YOLO大模型知识问答系统；③计算机视觉论文生成智能体；

10-10

1326

Wasserstein Distance Loss，助力小目标涨点

【论文精读】NWD:一种用于微小目标检测的归一化高斯Wasserstein距离（A Normalized Gaussian Wasserstein Distance for Tiny Object ）

慕溪同学的博客

03-27

8461

检测微小物体是一个非常具有挑战性的问题，因为微小物体仅包含几个像素大小。我们证明，由于缺乏外观信息，最先进的探测器在微小物体上无法产生令人满意的结果。我们的主要观察结果是，基于IoU (Intersection over Union)的度量(如IoU本身及其扩展)对微小物体的位置偏差非常敏感，并且在基于锚点的检测器中使用时会大大降低检测性能。

基于YOLOv8的交通摄像头下车辆检测算法（三）：Wasserstein Distance Loss，助力小目标检测

会AI的学姐

10-29

1182

Wasserstein Distance Loss在交通摄像头下车辆检测项目中，mAP50从原始的0.745提升至0.759

YOLO改进：【损失函数篇】提高小目标检测精度——Normalized Wasserstein Distance (NWD)损失函数

热门推荐

qq_36070656的博客

10-18

1万+

NWD损失函数助力小目标检测

通信基础 2——高斯分布及归一化、标准化、零均值化

Paul 的笔记库

03-08

1万+

目录高斯变量基础高斯分布概率密度函数性质复高斯分布概率密度函数应用零均值循环对称复高斯随机变量零均值化卡方分布补充归一化标准化高斯变量基础高斯分布概率密度函数性质复高斯分布若复高斯分布Z=X+iY, 且满足则有概率密度函数注：复高斯随机变量的密度函数，分母已经没有根号应用零均值循环对称复高斯随机变量特殊的，当μ=μx=μy=0时，Z称为零均值循环对称复高斯随机变量（zero mean circle symmetric complex gaussian,ZMCSCG）,σ2称为

wasserstein距离损失函数&SinkhornDistance代码

2301_77554343的博客

05-17

1089

wasserstein距离损失函数介绍(WGAN)和SinkhornDistance类的代码

芒果YOLOv7改进17：Loss篇：改进之NWDLoss 独家首发更新｜高效涨点2%改进用于小目标检测的归一化高斯 Wasserstein Distance Loss

包括YOLOv5、YOLOv7、YOLOv8等模型改进

02-24

7481

YOLOv7代码实践 + 结合用于小目标检测的Normalized Gaussian Wasserstein Distance, 一种新的包围框相似度度量，高效涨点

基于IoU的度量适用于一般的目标检测任务，对于小目标检测，为了克服自身对IoU值的敏感性，提出了Dot Distance[13]和Normalized Wasserstein Distance (NWD)[14]。1) Dot Distance:其中D为GT盒中心点与锚框中心点之间的欧氏距离，S为目标在数据集中的平均大小。M表示图像数量，Ni表示第i张图像中标记的边界框数量，wij和hij分别表示第i张图像种中第j条边界的宽度和高度。2) 归一化高斯Wasserstein距离:

04-09

### 小目标检测中的 Dot Distance 和 Normalized Wasserstein Distance #### 1. **Dot Distance 的概念及其在小目标检测中的作用** Dot Distance 是一种衡量两个边界框中心点之间距离的方法。它可以通过简单的欧几里得距离公式计算得出，具体表达式为： \[ \text{Dot Distance} = \|b_c - b_{gt,c}\|_2 \] 其中 \( b_c \) 表示预测框的中心坐标，\( b_{gt,c} \) 表示真实框的中心坐标[^1]。对于小目标检测而言，由于物体尺寸较小，即使预测框与真实框非常接近也可能因为轻微的位置偏差而导致较低的 IoU 值。因此，单独依赖 IoU 可能无法充分反映模型的实际表现。而 Dot Distance 提供了一种补充指标，能够更精确地描述预测框相对于真实框的空间偏移程度。 #### 2. **Normalized Wasserstein Distance 的定义及优势** Normalized Wasserstein Distance（也称为 Earth Mover's Distance 或 EMD）是一种用于比较概率分布差异性的度量方法。它可以被扩展到边界框匹配场景下，用来量化不同候选区域间的相似性。其核心思想在于寻找最优传输方案使得源分布尽可能靠近目标分布的同时最小化总运输成本。针对二维空间内的矩形边界框 A 和 B ，它们各自对应的质量密度函数分别为 f_A(x,y),f_B(x,y)，则两者间 normalized wasserstein distance 计算公式可近似表示为: \[ W(A,B)=\inf _{\gamma \in \Pi(f_A,f_B)} \int |x-y|\mathrm {d} \gamma (x,y)/C \] 这里 C 是归一化的常数因子以确保最终结果处于合理范围之内[^2]。相比传统 IoU 方法仅关注重叠部分面积比例，Wasserstein 距离额外包含了形状特征信息如大小、方向等因素的影响，这使其特别适合处理那些存在显著尺度变化或者旋转角度不同的情况下的对象定位任务。 #### 3. **改进策略：结合 CIoU/DIoU 使用** 为了克服单纯依靠 IoU 存在局限性的问题，在实际应用过程中可以尝试融合上述提到的新颖测距手段——即同时利用 dot-distance 和 normalized-wasserstein-distance 来增强 ciou/diou 性能表现。例如可以在原有 diou/ciou loss function 上面增加一项基于这两种新型测量工具构建而成附加损失项，从而引导网络更好地学习如何调整输出结果满足更高精度需求: ```python def custom_loss(pred_boxes, gt_boxes): iou_term = compute_iou(pred_boxes, gt_boxes) # Compute DIoU term as usual rho_squared = torch.sum((pred_boxes[:, :2] - gt_boxes[:, :2])**2, dim=-1) c_squared = torch.sum(((torch.max(pred_boxes[:, :2], gt_boxes[:, :2]) - torch.min(pred_boxes[:, 2:], gt_boxes[:, 2:]))**2), dim=-1) diou_distance_penalty = rho_squared / c_squared # Add new terms based on dot distance and normalized wasserstein distance dot_distance = torch.norm(pred_boxes[:, :2] - gt_boxes[:, :2], p=2, dim=-1) norm_wass_dist = calculate_normalized_wasserstein_distance(pred_boxes, gt_boxes) total_loss = 1 - iou_term + diou_distance_penalty + alpha * dot_distance + beta * norm_wass_dist return total_loss.mean() ``` 在这个例子中 `alpha` 和 `beta` 控制着新增加两项的重要性权重参数值设定需依据实验效果灵活调节优化. --- ####