Aggregation Signature for Small Object Tracking(论文翻译)

本文提出了一种新的聚合签名技术,专门用于小目标跟踪,特别是在面临突然大漂移时。通过结合显著性信息和在线学习机制,聚合签名能够更准确地检测和跟踪小目标。实验表明,这种方法在多个数据集上提高了跟踪性能,特别是在处理图像中的背景抑制和漂移检测方面。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

摘要

1.引言

2.聚合签名

A.聚合签名的定义

B.前景聚合签名属性

3.聚合签名跟踪器

4.实验

A.数据集

B.图像上的聚合签名

C.跟踪上的聚合签名

5.结论


论文地址:https://arxiv.org/pdf/1910.10859.pdf

数据集:https://github.com/bczhangbczhang/

摘要

        小目标跟踪成为一项越来越重要的任务,但在计算机视觉领域却鲜有人涉足。最大的挑战来自于这样一个事实:1)小物体的外观非常模糊和多变,2)它们比正常大小的物体更容易因为镜头的晃动而丢失。本文提出了一种新的适用于小目标跟踪的聚合签名,特别是针对突发大漂移的挑战。我们在这项工作中有三方面的贡献。首先,在技术上,我们提出了一种新的描述符,称为聚集签名,它基于显著性,能够表示小目标的高度不同的特征。其次,从理论上证明了所提出的签名能够以较高的概率更准确地匹配前景目标。第三,在实验上,聚合签名在多个数据集上取得了很高的性能,远远超过了最先进的方法。此外,我们还提供了两个新收集的基准数据集,即Small 90和Small 112,用于视觉上的小目标跟踪。数据集将在https://github.com/bczhangbczhang/.中提供

1.引言

        虽然在过去的十年中已经开发了几种跟踪方法[1]、[2]、[3]、[4]、[5]、[6]、[7],并且已经被证明在许多应用中是成功的,例如机器人或视频监控,但是跟踪视频中的小目标仍然是一个具有挑战性的问题,特别是当要考虑复杂的场景和实时约束时。在本文中,小目标是指图像中目标的大小不到整个图像的1%。小目标跟踪面临的挑战主要有两个方面:一是小目标的视觉特征非常反复无常,使得特征表示变得困难;第二,和正常大小的目标相比,在跟踪过程中,由于镜头的抖动,经常会出现小目标突然大漂移的情况所谓突然大漂移,就是图像坐标系中相邻两帧之间的目标距离比目标大小大两倍

        长期以来,研究人员只报道了使用合理大小目标的常见基准的跟踪结果,而对小目标跟踪问题关注较少。现有的与小目标跟踪相关的算法很少,而这些算法是为增强这类目标的视觉特征而设计的,希望在利用鲁棒特征的情况下,跟踪的目标不会再丢失。例如,[8]、[9]中的方法综合了空域和频域特征,以便更精确地定位目标。或者,[10]中的方法倾向于通过加强小目标的特征表示(例如,目标属性)来增强跟踪器的稳健性。最近,Rozumnyi 等人[11]提出了解决目标快速运动和运动模糊的方法,但由于分辨率低、背景杂波复杂等原因,性能不尽如人意。考虑到目前已经开发的深度学习方法[12][13],我们认为高级特征似乎对小对象并不有效。此外,考虑到小目标很容易与真实场景中的噪声和杂波混淆,即使利用了鲁棒的视觉特征,我们也怀疑能否保证对小目标的连续跟踪。换句话说,让小物体在跟踪过程中丢失,同时研究一种更好的解决方案来重新检测它们,可能会更现实

        这里的直觉是关于“当小目标由于杂乱的背景而丢失时,人类如何识别它?”最有可能的是,人类首先查看场景中弹出的显著对象/区域,然后进一步验证其中一个显著对象是否是感兴趣的目标[14]。少数作品模仿人的行为,在目标跟踪中涉及显著信息。例如,[15]中的方法集成了上下文表示的显著性,而[16]、[17]、[18]中的方法以各种方式将显著性合并到外观模型中,以提高跟踪器的鲁棒性。然而,由于它们大多集中在图像域中的目标外观上,性能并不令人满意,因为对于小目标而言,外观隐含地很弱。因此,它们可能只可靠地应用于跟踪正常大小的目标。在本文中,我们提出了一种新的显著性在线学习框架,称为聚合签名,并重点研究了小目标跟踪。就我们所知,目前还没有一种基于显著性的方法利用所有上下文信息(包括强度、饱和度、显著性和运动信息)来跟踪小目标。

        与手工制作的图像签名不同,手工制作的图像签名是在图像空间匹配稀疏前景目标的简单而强大的工具,我们的聚合签名的明显优势在于利用一种学习机制来构建自适应目标签名。结果是,即使目标很小,它也能快速检测出显著目标,从而进一步提高跟踪器的(再)定位性能。我们通过模仿人类的注意机制,开辟了跟踪小目标的新方向。特别地,理论证据证明了该方法更有效,并且从聚合签名得到的前景显著图在迭代过程中变得与目标外观更一致,如图1所示。此外,聚合签名具有很强的通用性,可以集成到其他跟踪器中。综上所述,本文的贡献包括:

 图1:聚合签名结果在不同的迭代中显示,反映了跟踪的目标在学习过程中变得更加突出。我们的聚合签名首次尝试将跟踪到的目标信息融入到四元数离散余弦变换(QDCT)图像签名中,并从理论上证明了它的聚合能力。

 (I)从理论上证明了所提出的聚合签名对于稀疏前景检测更有效,使得跟踪目标比背景更显著。

(II)聚合签名基于学习机制提高了为目标积累信息的能力,而传统的图像签名是手工制作的,更容易无法适应目标。

(III)收集新的具有挑战性的数据集--Small 90和Small 112--用于小目标跟踪评估。这些数据集是公开的,可用于进一步的研究开发。

2.聚合签名

        图像签名是一种简单但功能强大的工具,可以在空间上匹配图像的稀疏前景[19]。通过使用DCT的符号函数,得到的手工生成的描述符可以有效地近似检测图像的显著区域。QDCT[20]通过引入四元数分量来区分四个分量的相对重要性,而不是将彩色图像分成三个通道图像并分别计算图像签名。通常,基于DCT和QDCT的图像签名都是手工制作的方法,不涉及学习过程。另一方面,所提出的聚合签名通过学习多线索信息,特别是目标先验信息,提高了QDCT签名的区分能力。

A.聚合签名的定义

        我们首先考虑一个显示以下结构的图像x:

 其中f表示前景,b表示背景。有关本节其余部分使用的定义,请参阅表I。形式上,聚合签名(AS)定义为:

 其中sign(·)是入口符号运算符,i表示第i次迭代,Q表示正在使用的4个通道。然后,可以将重建图像定义为:

并且

 其中

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值