OSTrack: Joint Feature Learning and Relation Modeling for Tracking: A One-Stream Framework论文和代码结构解读

论文地址
代码地址

写在前面

OSTrack和ODTrack代码结构和内容基本一致,主要是采样方法有所区别

问题在哪?

  • Two-Stream框架提取的特征,对目标的敏感度不高。其提取的特征是在离线训练后确定的,因此Template和Search区域之间没有交互。同时,由于Target是在不断变化的,所以Two-Stream对前景和背景的区分能力是有限的。
  • Two-Stream大致就是Template和Search的Feature Map经过特征融合等操作之后,送入Head,这样的过程会浪费算力。
    One_Two_stream

作者贡献

  • 修改ViT作为Backbone,实现One-Stream的框架;
  • 提出Candidate-Elimination模块,在Embedding中筛选Topk的值,消除无信息的背景信息,加强有信息的前景信息;
  • 在Patch-Embedding阶段进行特征早融合;
    在这里插入图片描述

具体方法

sample和ce_template_mask生成方法

在这里插入图片描述Search、Template和ce_template_mask各采样一张,这里没什么难度的。
主要是ce_template_mask生成,在OSTrack中,作者使用的是 C T R _ P O

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值