论文名称:SeqTrack: Sequence to Sequence Learning for Visual Object Tracking
论文代码:https://github.com/microsoft/VideoX
摘要
在本文中,我们提出了一种新的序列到序列学习框架的视觉跟踪,称为SeqTrack。它将视觉跟踪转换为一个序列生成问题,它以自回归的方式预测对象边界盒。这与之前的暹罗跟踪器和变压器跟踪器不同,它们依赖于设计复杂的头网络,如分类和回归头。SeqTrack只采用了一个简单的编解码器变压器架构。编码器使用双向转换器提取视觉特征,而解码器使用因果转换器自动回归生成一系列边界盒值。损失函数是一个普通的交叉熵。这种序列学习范式不仅简化了跟踪框架,而且在基准测试上取得了竞争性能。例如,SeqTrack在LaSOT上获得了72.5%的AUC,建立了一个新的最先进的性能状态。
介绍
在本文中,我们提出了一种新的序列到序列学习框架的视觉跟踪,称为SeqTrack。它将视觉跟踪转换为一个序列生成问题,它以自回归的方式预测对象边界盒。这与之前的暹罗跟踪器和变压器跟踪器不同,它们依赖于设计复杂的头网络,如分类和回归头。SeqTrack只采用了一个简单的编解码器变压器架构。编码器使用双向转换器提取视觉特征,而解码器使用因果转换器自动回归生成一系列边界盒值。损失函数是一个普通的交叉熵。这种序列学习范式不仅简化了跟踪框架,而且在基准测试上取得了竞争性能。例如,SeqTrack在LaSOT上获得了72.5%的AUC,建立了一个新的最先进的性能状态。