SiamCAR: Siamese Fully Convolutional Classification and Regression for Visual Tracking 阅读记录

最新推荐文章于 2025-01-18 18:16:43 发布

原创

最新推荐文章于 2025-01-18 18:16:43 发布 · 960 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉 #人工智能 #深度学习

SiamCAR是一种基于Siamese网络的视觉跟踪方法，将任务分解为像素分类和边界框回归。使用ResNet-50并避免描点，减少了人工干涉和超参数调整。通过联合训练分类和回归分支，实现目标尺度不变性，提高跟踪效率。文章对比其他跟踪算法，强调了无描点和模板更新策略对精度和效率的影响，以及如何利用低层和高层特征提高跟踪精度。

在这里插入图片描述

将视觉跟踪任务分解成两个子任务：像素分类和边界框回归
SiamCAR框架包含两个子网络：一个用于特征提取，一个用于预测边界框
使用ResNet-50作为主干网络
与其他的最先进的跟踪算法比较，本文提出的框架是描点自由和无提议区域，这样能够避免复杂的超参数调整和减少人工干涉
所提出的框架简单，有效
在现实生活中的跟踪，算法会受到光照变化，尺度变化大，背景干扰和严重遮挡问题
除上述外，非刚性的物体的形状或者外观会发生不可预知的变化
Siamese网络将视觉跟踪任务定义为目标匹配问题，目的是学习目标模板和搜索区域之间的相似图
由于单个相似图像通常包含有限的空间信息，一种常见的策略实在搜索区域的多个尺度上进行匹配，以确定目标的尺度变化。但是这样也导致了一些追踪器费时费力
通过联合训练一个分类分支和一个回归分支用于跟踪，SiamRPN避免了耗时的步骤，并且也能够提取多尺度特征图的目标尺度不变性
SiamRPN等网络将锚点引入到目标区域中，而跟踪器对描点较为敏感
为了引入描点自由，这篇论文将跟踪问题分解为：分类问题和回归问题
分类分支：目的是将每个像素预测为一个标签
回归分支：将每个位置回归为一个相对的包围框
经过这样分解后，可以以逐像素预测的方式解决跟踪任务
SiamCAR旨在提取包含丰富类别信息和语义信息的响应图
SiamCAR只使用一个响应图去预测物体的位置和包围框
代码使用在线训练和离线跟踪的方法，并且没有使用到数据增强策略
Siamese RPN及其类似的跟踪器，是近年来广被研究的对象
模板更新策略可以提高模型的自适应性，但跟踪的效率

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。