Drone-Yolo:一种高效的无人机图像目标检测神经网络方法

本文提出Drone-YOLO,一系列基于YOLOv8的改进模型,针对无人机图像的目标检测,解决小目标检测难题。采用三明治融合模块优化颈部网络,增强小尺寸物体检测。实验表明,Drone-YOLO在VisDrone2019数据集上表现出色,尤其是在检测小目标时,参数更少的Drone-YOLO (tiny) 模型具有与大模型相当或更好的精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

https://www.mdpi.com/2504-446X/7/8/526
在各种研究领域中,对无人机的图像进行目标检测是一项有意义的任务。然而,无人机的图像带来了独特的挑战,包括图像尺寸大、检测对象尺寸小、对象密集分布、对象重叠以及光线不足影响目标检测的准确性。本文提出了Drone-YOLO,这是一系列基于YOLOv8模型的多尺度UAV图像目标检测算法,旨在克服与UAV图像目标检测相关的特定挑战。为了解决大场景尺寸和小型检测对象的问题,我们对YOLOv8模型的颈部组件进行了改进。具体来说,我们采用了三层PAFPN结构,并加入了一个针对小尺寸物体量身定制的检测头,使用了大规模的特征图,从而显著提高了算法对小型目标的检测能力。此外,我们将sandwich fusion模块整合到颈部上下分支的每一层中。这种融合机制将网络特征与低级特征相结合,为不同层检测头提供了丰富的空间信息。我们使用depthwise separable evolution实现这种融合,它在参数成本和大的接收域之间达到了平衡。在网络的骨干中,我们采用RepVGG模块作为下采样层,提高了网络学习多尺度特征的能力并超越了传统的卷积层。提出的Drone-YOLO方法已在消融实验中进行评估,并与VisDrone2019数据集上的其他最先进方法进行了比较。结果表明,我们的Drone-YOLO (large) 在目标检测准确性方面优于其他基线方法。与YOLOv8相比,我们的方法在mAP0.5指标上取得了显著改进,在VisDrone2019-test上增加了13.4%,在VisDrone2019-val上增加了17.40%。此外,参数高效的Drone-YOLO (tiny) 仅使用5.25M个参数,在数据集上的表现与使用9.66M个参数的基线方法相当或

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI智韵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值