通用单目标跟踪综述《Handcrafted and Deep Trackers: A Review of Recent Object Tracking Approaches》

最新推荐文章于 2025-08-04 22:22:49 发布

原创

最新推荐文章于 2025-08-04 22:22:49 发布 · 1.3k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#综述 #单目标跟踪 #相关滤波 #深度学习

本文全面回顾了目标跟踪领域，尤其是单目标跟踪的最新进展，重点探讨了相关滤波器在跟踪算法中的应用。文章详细介绍了基本的和正则化的相关滤波跟踪器，如KCF和SRDCF，并讨论了它们的局限性。同时，文章也提到了深度学习在目标跟踪中的作用，如DeepSRDCF和ECO等方法，展示了未来跟踪技术的发展趋势。

近年来，视觉目标跟踪成为一个非常活跃的研究领域。每年都会提出越来越多的跟踪算法。跟踪在人机交互、自动驾驶汽车、机器人、监控和安全等各种现实问题中有着广泛的应用。本文将回顾跟踪领域的最新的趋势和进展，并基于特征提取方法评估了不同跟踪算法的鲁棒性。我们将跟踪算法大致分为基于相关滤波的跟踪算法(CFTs)和非基于相关滤波的跟踪算法(Non-CFTs)。根据体系结构和跟踪机制，将每个类别进一步划分为不同的类型。最后，对本文的研究进行了总结，提出了一些见解，并指出了视觉目标跟踪领域的未来发展趋势。

A. 相关滤波器

在目标跟踪中，相关滤波器(CF)被用来提高鲁棒性和效率。最初，训练的需求使得CF不适合在线跟踪。近年来，最小输出平方误差和(MOSSE)滤波器[60]的发展，允许有效的自适应训练，改变了这种情况。
MOSSE滤波器的目标是使期望输出与实际输出在傅立叶域中的平方误差之和最小。MOSSE是平均合成精确滤波器(Average Synthetic precision Filter, ASEF)[61]的改进版，ASEF经过离线训练来检测目标。ASEF计算一组精确滤波器的平均值，每个滤波器都是从同一对象的不同训练图像中计算出来的，以得到输出的最佳滤波器。后来，许多最先进的CFT提出了基于MOSSE。

习惯上，设计CF的推理目的是生成背景值低、场景感兴趣区域值高的响应图。其中一种是带Kernal的循环结构[62]跟踪算法，该算法利用目标外观的循环结构，采用核正则化最小二乘法进行训练。

基于cf的跟踪方案在频域内进行计算，以控制计算成本。这些算法的总体架构遵循基于检测的跟踪方法，如图2所示。相关滤波器由序列的初始帧目标位置的裁剪目标patch图像初始化。

在跟踪过程中，使用上一帧的目标估计位置估计目标在新一帧中位置。为了有效地表示目标的外观，采用合适的特征提取方法从输入的patch中构造特征映射。边界通过应用余弦滤波器平滑。
进行相关运算，而不是累加卷积运算(exhausted convolution operation)。利用自适应学习滤波器和提取的特征之间的按元素(Element-wise)相乘，以及离散傅里叶变换(DFT)来计算响应图(r

最低0.47元/天解锁文章