无惧遮挡 & 小目标！复旦开源UAV-DETR：无人机图像的高效端到端目标检测

最新推荐文章于 2025-05-27 07:06:55 发布

计算机视觉工坊

最新推荐文章于 2025-05-27 07:06:55 发布

阅读量1.4k

点赞数 26

CC 4.0 BY-SA版权

文章标签：开源无人机目标检测目标跟踪人工智能计算机视觉机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_46788581/article/details/145061372

0. 论文信息

标题：UAV-DETR: Efficient End-to-End Object Detection for Unmanned Aerial Vehicle Imagery

作者：Huaxiang Zhang, Kai Liu, Zhongxue Gan, Guo-Niu Zhu

机构：Fudan University

原文链接：https://arxiv.org/abs/2501.01855

代码链接：https://github.com/ValiantDiligent/UAV-DETR

1. 导读

无人机目标检测(UAV-OD)已经广泛应用于各种场景。然而，大多数现有的UAV-OD算法依赖于手动设计的组件，这需要大量的调整。不依赖于这种人工设计的组件的端到端模型主要是为自然图像设计的，对于无人机图像效果较差。为了应对这些挑战，本文提出了一种适用于无人机图像的高效检测变压器(DETR)框架，即无人机DETR。该框架包括具有频率增强模块的多尺度特征融合，该模块在不同尺度上捕获空间和频率信息。此外，提出了一种频率聚焦下采样模块，以在下采样期间保留关键的空间细节。开发了语义对齐和校准模块来对齐和融合来自不同融合路径的特征。实验结果证明了该方法在不同无人机图像数据集上的有效性和推广性。在VisDrone数据集上，我们的方法将AP提高了3.1%美国联合通讯社(Associated Press)50超出基线4.2%。在UAVVaste数据集上也观察到了类似的增强。

2. 效果展示

无人机视觉中的目标特征比正常视觉中的更为复杂。航拍图像面临着小目标尺寸和遮挡等挑战。因此，检测无人机图像中的目标通常受益于详细的特征提取。在局部特征可能无法提供足够信息的情况下，融入目标与周围环境之间的关系将是提高检测精度的一种可行选择。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。