Drone-Yolo:一种高效的无人机图像目标检测神经网络方法-优快云博客

本文提出Drone-YOLO，一系列基于YOLOv8的改进模型，针对无人机图像的目标检测，解决小目标检测难题。采用三明治融合模块优化颈部网络，增强小尺寸物体检测。实验表明，Drone-YOLO在VisDrone2019数据集上表现出色，尤其是在检测小目标时，参数更少的Drone-YOLO (tiny) 模型具有与大模型相当或更好的精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

https://www.mdpi.com/2504-446X/7/8/526
在各种研究领域中，对无人机的图像进行目标检测是一项有意义的任务。然而，无人机的图像带来了独特的挑战，包括图像尺寸大、检测对象尺寸小、对象密集分布、对象重叠以及光线不足影响目标检测的准确性。本文提出了Drone-YOLO，这是一系列基于YOLOv8模型的多尺度UAV图像目标检测算法，旨在克服与UAV图像目标检测相关的特定挑战。为了解决大场景尺寸和小型检测对象的问题，我们对YOLOv8模型的颈部组件进行了改进。具体来说，我们采用了三层PAFPN结构，并加入了一个针对小尺寸物体量身定制的检测头，使用了大规模的特征图，从而显著提高了算法对小型目标的检测能力。此外，我们将sandwich fusion模块整合到颈部上下分支的每一层中。这种融合机制将网络特征与低级特征相结合，为不同层检测头提供了丰富的空间信息。我们使用depthwise separable evolution实现这种融合，它在参数成本和大的接收域之间达到了平衡。在网络的骨干中，我们采用RepVGG模块作为下采样层，提高了网络学习多尺度特征的能力并超越了传统的卷积层。提出的Drone-YOLO方法已在消融实验中进行评估，并与VisDrone2019数据集上的其他最先进方法进行了比较。结果表明，我们的Drone-YOLO (large) 在目标检测准确性方面优于其他基线方法。与YOLOv8相比，我们的方法在mAP0.5指标上取得了显著改进，在VisDrone2019-test上增加了13.4%，在VisDrone2019-val上增加了17.40%。此外，参数高效的Drone-YOLO (tiny) 仅使用5.25M个参数，在数据集上的表现与使用9.66M个参数的基线方法相当或