本文来源公众号“江大白”,仅用于学术分享,侵权删,干货满满。
原文链接:小目标物体检测方法:基于距离相似度的标签分配策略(附论文及源码)
导读
在计算机视觉中,小目标检测由于信息不足而具有挑战性。对此,本文提出相似距离(SimD)策略,提升检测准确性。SimD自适应学习超参数,适应不同数据集和物体大小,在多个数据集上表现出色,特别是在AI-TOD数据集上显著提高精度,且无需设置超参数!
论文链接:https://arxiv.org/pdf/2407.02394v3
代码链接:https://github.com/cszzshi/SimD
摘要
小物体检测正成为计算机视觉中最具挑战性的任务之一,这是因为物体尺寸有限以及信息不足。标签分配策略是影响物体检测准确性的一个关键因素。尽管存在一些针对小物体有效的标签分配策略,但大多数策略侧重于降低对边界框的敏感度以增加正样本的数量,并且具有一些需要设置的固定超参数。然而,更多的正样本并不一定带来更好的检测结果;实际上,过多的正样本可能导致更多的假阳性。在本文中,我们介绍了一种简单而有效的策略,名为相似距离(SimD),用于评估边界框之间的相似度。该提出的策略不仅考虑了位置和形状的相似性,而且还能够自适应地学习超参数,确保它可以适应不同的数据集及数据集中各种大小的物体。我们的方法可以轻松应用于常见的基于锚点的检测器中,用来替代交并比(IoU)进行标签分配和非极大值抑制(NMS)。在四个主流的小型物体检测数据集上的大量实验表明了我们方法的优越性能,特别是在 AI-TOD 数据集上,对于非常小型的目标,我们的方法分别高出最先进的竞争对手 1.8 个 AP 点和 4.1 个 AP 点。代码可在以下网址获取:https://github.com/cszzshi/SimD。
1、介绍
随着无人机技术和自动驾驶技术的普及,物体检测的应用在日常生活中变得越来越广泛。通用物体检测器在准确性和检测速度方面已经取得了显著的进步。例如,YOLO系列的最新版本YOLOv8在COCO检测数据集上实现了53.9%的平均精度均值(mAP),并且当使用TensorRT在NVIDIA A100 GPU上实现时,检测一张图像中的物体只需3.53毫秒。然而,尽管通用物体检测器取得了这些显著进展,当它们直接应用于小型物体检测任务时,其准确性会急剧下降。
在最近的一项关于小型物体检测的综述中,Cheng等人根据其平均面积将小型物体分为三个类别(极其小、相对小和一般小)。小型物体检测面临的两大挑战是信息损失和正样本的缺乏。有许多可能的方法可以提高小型物体检测的准确性,如特征融合、数据增强和超分辨率处理。
因为足够多的高质量正样本对于物体检测至关重要,因此标签分配策略是影响最终结果的核心因素。物体越小,交并比(IoU)指标