1.摘要:
基于孪生网络的跟踪器将视觉跟踪任务描述为一个相似度匹配问题。几乎所有流行的Siamese跟踪器都是通过目标分支和搜索分支之间的卷积特征互相关来实现相似度学习的。但是,由于需要预先确定目标特征区域的大小,这些互相关基方法要么保留了大量不利的背景信息,要么丢失了大量的前景信息。此外,目标与搜索区域的全局匹配也在很大程度上忽略了目标结构和部分级信息(structure and part-level information)。
针对上述问题,本文提出了一种简单的目标感知Siamese图注意网络,用于一般目标跟踪。提出用完全二部图( complete bipartite graph)建立目标与搜索区域的部分-部分对应关系,并利用图注意机制将目标信息从模板特征传播到搜索特征。此外,我们研究了一种目标感知区域选择机制,以适应不同对象的大小和宽高比变化,而不是使用预先固定的区域裁剪来进行模板特征区域选择。在包括GOT-10k、UAV123、OTB-100和LaSOT在内的具有挑战性的基准上进行的实验表明,提出的SiamGAT优于许多先进的跟踪器,实现了领先的性能。代码可在:https: // git。io / SiamGAT。
2.问题的提出
(1)提出问题:
如何嵌入两个分支的信息来获取响应图是一个关键问题,因为从模板传递到搜索区域的信息对对象的精确定位至关重要。
(2)目前基于互相关方法存在的问题:
1