多无人机多目标跟踪Robust Multi-Drone Multi-Target Tracking to Resolve Target Occlusion: A Benchmark

多无人机多目标跟踪Robust Multi-Drone Multi-Target Tracking to Resolve Target Occlusion: A Benchmark

摘要

多无人机多目标跟踪旨在协同检测和跟踪多个无人机中的目标,并关联来自不同无人机的对象身份,从而克服单无人机目标跟踪的缺点。为了解决多无人机多目标跟踪任务中身份关联和目标遮挡的关键挑战,我们收集了一个感知遮挡的多无人机多目标跟踪数据集,称为MDMT。该数据集包含88段视频序列,39,678帧,包括11,454个不同的ID(行人、自行车和汽车)。MDMT数据集包含2,204,620个边界框,其中543,444个边界框包含目标遮挡。我们还设计了一个多设备目标关联评分(MDA),作为评估多设备跟踪中跨视角目标关联能力的标准。此外,我们提出了用于多无人机多目标跟踪任务的多匹配身份认证网络(MIA-Net)。MIA-Net中的局部-全局匹配算法发现了跨无人机目标的拓扑关系,有效解决了跨无人机的关联问题,并通过多无人机视角映射的优势有效补充了被遮挡的目标。在MDMT数据集上的大量实验验证了我们提出的MIA-Net在身份关联和多目标跟踪任务中处理遮挡问题的有效性。

前言

高质量、大规模的数据集在开发基于无人机的先进、高效的目标检测和跟踪算法中起着重要作用。近年来,针对单无人机检测和跟踪收集了许多基准数据集,包括VisDrone、UAV123、UAVDT、DroneCrowd和DroneVehicle。然而,针对使用多架无人机的多目标检测和跟踪的数据集较少。因此,在这项工作中,我们构建了一个多无人机多目标跟踪(MDMT)数据集,结合了无人机和多摄像头多目标跟踪系统的优势。MDMT数据集包含88组视频片段,共计39,678帧高分辨率图像,由两架无人机拍摄。该数据集涵盖多个场景,包括城市道路、郊区道路、停车场等,拍摄时间从白天到晚上不等。在MDMT数据集中,共标注了2,204,620个目标,其中543,444个为被遮挡目标。据我们所知,这是迄今为止最大、最详细注释的多无人机多目标跟踪数据集。

与现有的多摄像头跟踪任务不同,单架无人机捕捉的密集目标具有较高的无人机内相似性,而无人机的高空倾斜视角使得跨无人机的相同目标难以关联。本文提出了多匹配身份认证网络(MIA-Net),使用跟踪与匹配策略,通过协调全局匹配和局部匹配来实现多个无人机之间的目标关联和跟踪。MIA-Net利用多无人机视角的互补信息,在遮挡场景中实现了鲁棒且准确的多目标跟踪。全局匹配利用整个图像的关键点信息进行匹配,而局部匹配通过多个无人机之间目标拓扑网络的映射关系进行匹配,这种方法简单且高效,能够精确匹配来自不同无人机的目标。

本文的主要贡献如下:

  1. 我们构建了一个具有遮挡属性的多无人机多目标跟踪数据集,称为MDMT。该数据集是首个且最大的多无人机多目标跟踪数据集,为多无人机多目标检测和跟踪方向的研究人员提供了重要的数据平台。
  2. 我们设计了一种新的多设备多目标跟踪评估指标——多设备目标关联评分(MDA),可用于评估多设备系统中目标跟踪方法的关联程度。该评估指标旨在激发研究人员设计更优越、高效的多设备多目标跟踪融合策略。
  3. 我们提出了一种基于跟踪与匹配策略的基线方法——多匹配身份认证网络(MIA-Net),用于解决多无人机协同多目标跟踪任务中的目标遮挡问题。我们在MDMT数据集上进行了大量实验,验证了MIA-Net
数据集介绍:无人机视角目标检测数据集 数据集名称:无人机视角目标检测数据集 数据规模: - 训练集:16,058张航拍图片 - 验证集:878张图片 - 测试集:891张图片 目标类别: 1. Insan(人类):无人机视角下的行人、人群等动态目标 2. Tasit(交通工具):包含车辆、飞行器等移动载具的检测 3. UAI(无人机相关目标):空中作业的无人机本体检测 4. UAP(无人机平台设施):起降平台、充电站等静态基础设施 标注格式: - YOLO格式标注,包含目标边界框与类别标签 - 数据来源于无人机航拍图像数据库,覆盖种拍摄角度 城市空中交通管理: 支持无人机交通流量监控系统开发,实时检测空中移动目标,提升低空领域安全管理能力 智能安防系统: 适用于边境巡逻、大型活动安保等场景,通过目标协同检测实现异常行为识别 灾害救援应用: 集成至救灾无人机系统,快速定位受困人员与可通行路径,提升救援效率 无人机算法开发: 为避障导航、自动跟拍等算法提供训练数据,覆盖复杂环境下的目标交互场景 学术研究领域: 适用于计算机视觉与无人机技术交叉研究,支持多目标跟踪、小目标检测等前沿方向 维度目标覆盖: 同时包含动态目标(行人/载具)与静态基础设施,满足复合场景下的检测需求 规模与精度并重: 超1.6万张训练图片提供充足样本,标注文件经专业团队校验,边界框定位精确 视角样性: 涵盖高空俯视、倾斜拍摄等角度样本,模拟真实无人机作业视角 环境适配性强: 包含城市建筑群、自然景观等种背景,有效提升模型泛化能力 任务扩展性佳: 兼容YOLO系列模型训练,支持向目标跟踪、行为分析等任务延伸
### MDMT 数据集介绍 MDMT(Multi-Drone Multi-Target Tracking Dataset)数据集是一个专为无人机目标追踪设计的大规模数据集[^2]。此数据集由88组视频剪辑构成,总计含有39,678帧高分辨率图像,这些图像是利用两架无人机拍摄得到的。MDMT覆盖了样化的场景设置,比如城市道路、乡村区域的道路、停车场以及其他不同环境,并且记录的时间跨度从白天延伸至夜晚。 在MDMT数据集中总共标记了超过2百万的目标实例——确切地说是2,204,620个个体对象,其中特别值得注意的是存在大量的遮挡情况下的目标标注,数量达到了543,444个被部分或完全遮挡的对象。这使得MDMT成为当前为止规模最大且最为详尽地标记过的同类数据集之一。 ### 使用方法 为了有效使用MDMT数据集进行研究工作或者算法测试: 1. **获取访问权限** 需要先联系数据集发布方申请下载链接或其他形式的数据分发渠道。 2. **准备计算资源** 考虑到数据量较大以及处理复杂度较高,建议准备好足够的存储空间和高性能GPU支持的计算机设备来进行数据分析与模型训练。 3. **加载并预处理数据** 利用Python等编程语言编写脚本读取视频文件及其对应的标签信息;可能还需要做一些额外的数据清洗工作以确保输入质量满足特定需求。 4. **实施实验方案** 可以采用现有的跟踪框架如MIA-Net(Autoassign+Bytetrack)[^1]作为基线解决方案,在此基础上调整参数配置或是引入新的技术改进点来提高性能表现特别是在面对遮挡挑战时的效果。 5. **评估结果** 应当定义合理的评价指标体系用于衡量所提方法的有效性和优越性,例如iDF1得分可以作为一个重要的参考依据。 ```python import cv2 from pathlib import Path def load_video_frames(video_path): frames = [] cap = cv2.VideoCapture(str(video_path)) while(cap.isOpened()): ret, frame = cap.read() if not ret: break frames.append(frame) cap.release() return frames video_dir = Path('path_to_mdmtdataset_videos') for video_file in video_dir.glob('*.mp4'): frames = load_video_frames(video_file) # 进一步处理每一帧... ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大泽泽的小可爱

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值