
- 将视觉跟踪任务分解成两个子任务:像素分类和边界框回归
- SiamCAR框架包含两个子网络:一个用于特征提取,一个用于预测边界框
- 使用ResNet-50作为主干网络
- 与其他的最先进的跟踪算法比较,本文提出的框架是描点自由和无提议区域,这样能够避免复杂的超参数调整和减少人工干涉
- 所提出的框架简单,有效
- 在现实生活中的跟踪,算法会受到光照变化,尺度变化大,背景干扰和严重遮挡问题
- 除上述外,非刚性的物体的形状或者外观会发生不可预知的变化
- Siamese网络将视觉跟踪任务定义为目标匹配问题,目的是学习目标模板和搜索区域之间的相似图
- 由于单个相似图像通常包含有限的空间信息,一种常见的策略实在搜索区域的多个尺度上进行匹配,以确定目标的尺度变化。但是这样也导致了一些追踪器费时费力
- 通过联合训练一个分类分支和一个回归分支用于跟踪,SiamRPN避免了耗时的步骤,并且也能够提取多尺度特征图的目标尺度不变性
- SiamRPN等网络将锚点引入到目标区域中,而跟踪器对描点较为敏感
- 为了引入描点自由,这篇论文将跟踪问题分解为:分类问题和回归问题
- 分类分支:目的是将每个像素预测为一个标签
- 回归分支:将每个位置回归为一个相对的包围框
- 经过这样分解后,可以以逐像素预测的方式解决跟踪任务
- SiamCAR旨在提取包含丰富类别信息和语义信息的响应图
- SiamCAR只使用一个响应图去预测物体的位置和包围框
- 代码使用在线训练和离线跟踪的方法,并且没有使用到数据增强策略
- Siamese RPN及其类似的跟踪器,是近年来广被研究的对象
- 模板更新策略可以提高模型的自适应性,但跟踪的效率

SiamCAR是一种基于Siamese网络的视觉跟踪方法,将任务分解为像素分类和边界框回归。使用ResNet-50并避免描点,减少了人工干涉和超参数调整。通过联合训练分类和回归分支,实现目标尺度不变性,提高跟踪效率。文章对比其他跟踪算法,强调了无描点和模板更新策略对精度和效率的影响,以及如何利用低层和高层特征提高跟踪精度。
最低0.47元/天 解锁文章
8160

被折叠的 条评论
为什么被折叠?



