物体跟踪-CVPR16-tracking[下]

本文总结了三篇关于物体跟踪的论文,包括Recurrently Target-Attending Tracking利用RNN增强跟踪的鲁棒性,Hedged Deep Tracking通过结合高层和低层卷积特征改进跟踪性能,以及Hierarchical Convolutional Features for Visual Tracking使用金字塔搜索策略进行精细化匹配。这些方法通过不同的深度学习技术提升了跟踪算法的效果,但速度和鲁棒性仍有优化空间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

接着上一篇博客,今天对剩下的文章进行简单总结,同样,文章只对paper的主要特点,和流程框架进行总结,具体细节尽可能不涉及。

一,Recurrently Target-Attending Tracking

首先介绍这一片文章,作者主要将RNN运用到物体跟踪上,主要想解决遮挡等问题。其实这篇文章思路和KCF和SRDCF思路一样,只是将其与RNN进行了结合,而且作者在公式说明上写的很复杂,其实原理并不复杂。简单的理解作者的贡献就是:通过RNN获取considence map,并将其作为SRDCF惩罚项w的值(原始SRDCF惩罚项是Gauss分布的值来抑制boundary effect,作者要用RNN来获得w是期望提高没有遮挡部分的impact,降低遮挡部分的影响,而且具有context信息,从而提高算法对遮挡的鲁棒性)。

  • 特点
    • 将RNN运用到tracking,结合grid思想,将区域划分为grid,并对每个grid进行四个方向RNN。
    • 将RNN的得到的结果(confidence map)用初始化SRDCF loss function的惩罚项。
    • 作者给出的实验结果(只给出了filter based methods的比较)来看,效果还可以。但是速度慢:4fps

本文首先将候选区域进行grid划分,然后对其提取特征,将每一个grid区域进行四个方向的RNN,然后叠加得到RNN输出的confidence map。那么为啥要用到RNN呢,并且划分grid呢?

  1. 首先grid主要是part-based思想的运用。可以通过mask控制grid,从而期望解决(目标被)遮挡问题。
  2. RNN比其LSTM来说,RNN具有low-freedom parameter space,而跟踪问题本身样本少,容易overfit,RNN这一性质可以缓和过拟合。

在RNN阶段,作者利用softmax来获取confidence map,并肩这个值作为如下公式中的W(如下公式其实就是SRDCF中的loss function),用该loss function 训练滤波器。求解过程和SRDCF一样。

  • 说到这里,这下可以直接给出作者的pipeline了:
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值