参考多目标跟踪(RMOT)是当前跟踪领域的一个重要课题。它的任务形式是引导跟踪器跟踪与语言描述匹配的目标。目前的研究主要集中在单视图下的多目标跟踪,指的是一个视图序列或多个不相关的视图序列。然而,在单一视图中,目标的某些外观很容易不可见,导致目标与语言描述的不正确匹配。在这项工作中,我们提出了一个新的任务,称为交叉视图参考多目标跟踪(CRMOT)。它引入了交叉视图来从多个视图中获取目标的外观,避免了RMOT任务中目标外观不可见的问题。CRMOT是一项更具挑战性的任务,即准确跟踪与语言描述匹配的目标,并保持每个交叉视图中目标的身份一致性。为了推进CRMOT任务,我们构建了一个基于CAMPUS和DIVOTrack数据集的交叉视图参考多目标跟踪基准,称为CRTrack。具体来说,它提供了13个不同的场景和221种语言描述。此外,我们提出了一种端到端的交叉视图参考多目标跟踪方法,称为CRTracker。在CRTrack基准上进行的大量实验验证了我们方法的有效性。
论文链接:https://arxiv.org/abs/2412.17807
代码链接:https://github.com/chen-si-jia/CRMOT
为此自动驾驶之心很荣幸邀请到华中科技大学在读博士生陈思佳,为大家分享他们AAAI 2025中稿的这篇工作。
>>直播和内容获取转到→自动驾驶之心知识星球
国内首个自动驾驶学习社区
『自动驾驶之心知识星球』近4000人的交流社区,已得到大多数自动驾驶公司的认可!涉及30+自动驾驶技术栈学习路线,从0到一带你入门自动驾驶感知(端到端自动驾驶、世界模型、仿真闭环、2D/3D检测、语义分割、车道线、BEV感知、Occupancy、多传感器融合、多传感器标定、目标跟踪)、自动驾驶定位建图(SLAM、高精地图、局部在线地图)、自动驾驶规划控制/轨迹预测等领域技术方案、大模型,更有行业动态和岗位发布!欢迎扫描加入

【自动驾驶之心】技术交流群
自动驾驶之心是国内领先的技术交流平台,关注自动驾驶前沿技术与行业、职场成长等。我们成立了一系列的技术交流群,涉及:语义分割、车道线检测、2D/3D目标跟踪、2D/3D目标检测、BEV感知、多模态感知、Occupancy、多传感器融合、transformer、大模型、点云处理、端到端自动驾驶、在线地图、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、Gaussian Splatting、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等多个方向!
备注:学校/公司+方向+昵称(快速入群方式)
点击下方卡片,关注“自动驾驶之心”公众号
ADAS巨卷干货,即可获取