
文章目录
1、Background
transformer 的方法做单目标跟踪的综述
两大类,CNN-Transformer based 和 Fully-Transformer based

SOT 相关的综述汇总

Transformer 首次在 NLP 中提出

Transformer 在 computer vision 上的应用


通常,Transformer架构需要大量训练样本来训练其模型。由于目标是在跟踪序列的第一帧中给出的,因此在VOT中不可能获得大量样本,因此所有完全基于Transformer和基于CNN-Transformer的跟踪器都使用预先训练的网络,并将其视为骨干模型

CNN-Transformer based 的方法都是 two-stream two-stage 的
feature extraction and feature fusion of target template and search region are done in two distinguishable stages (two stage).
feature fusion 例如 siamRPN 中的相关操作

2、CNN-Transformer based trackers
第一篇 CNN-Transformer SOT 方法
Wang N, Zhou W, Wang J, et al. Transformer meets tracker: Exploiting tem

最低0.47元/天 解锁文章
3409

被折叠的 条评论
为什么被折叠?



