STARK:Learning Spatio-Temporal Transformer for Visual Tracking论文及代码结构解读

论文地址
代码地址

写在前面

什么是One-stream和Two-stream,参考文章

Two-stream pipeline

如图所示,search和template分支是独立两根流线,提取特征后计算互相关信息,也是最常用的,缺点是提取的特征缺乏目标的感知性,对目标-背景的区分能力有限,两个patch之间信息交互度较差
two-stream

One-stream pipeline

如图所示,单流程的pipeline在特征完成提取前,就进行了信息交互,然后再进行各种互信息的计算,通用的是template与所有计算search的互信息之前,与search所有部分进行交互。有点是对前景和背景的区分能力强,两个patch间的交互程度高。
one-stream

作者的做法

数据采样

作者在一个序列中采样了
“一张 S e a r c h ”和“两张 T e m p l a t e ”, “一张Search”和“两张Template”, 一张Search两张Template
经过NestedTensor打包, 送入backbone,之后生成的特征拼接成维度为 [ B a t c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值