RGBT Tracking via Progressive Fusion Transformerwith Dynamically Guided Learning

ProFormer:RGBT跟踪中的渐进式融合Transformer与动态引导学习
文章介绍了一种新的RGBT跟踪方法,ProFormer,通过渐进式融合Transformer解决模态间差异问题,并结合动态引导学习算法优化单模态分支。该方法在RGBT210、RGBT234、LasHeR和VTUAV数据集上表现出色。

通过具有动态引导学习功能的渐进式融合变压器进行 RGBT 跟踪

Abstract: 

        现有的基于 Transformer 的 RGBT 跟踪方法要么使用交叉注意力来融合两种模态,要么使用自注意力和交叉注意力来对模态特定信息和模态共享信息进行建模。然而,模态之间显着的外观差距限制了融合过程中某些模态的特征表示能力。为了解决这个问题,我们提出了一种名为 ProFormer 的新型渐进式融合变压器,它逐步将单模态信息集成到多模态表示中,以实现鲁棒的 RGBT 跟踪。特别是,ProFormer首先使用自注意力模块来协作提取多模态表示,然后使用两个交叉注意力模块分别将其与双模态的特征进行交互。这样,可以在多模态表示中很好地激活模态特定信息。最后,使用前馈网络融合两个交互的多模态表示,以进一步增强最终的多模态表示。此外,RGBT跟踪器现有的学习方法要么将多模态特征融合为一个以进行最终分类,要么通过竞争性学习策略利用单模态分支和融合分支之间的关系。然而,它们要么忽略单模态分支的学习,要么导致一个分支无法得到很好的优化。为了解决这些问题,我们提出了一种动态引导学习算法,自适应地使用表现良好的分支来指导其他分支的学习,以增强每个分支的表示能力。大量实验表明,我们提出的 ProFormer 在 RGBT210、RGBT234、LasHeR 和 VTUAV 数据集上设置了新的最先进性能。

Introduction:

        RGB 和热线索的聚合使视觉跟踪器能够在照明变化、背景杂乱和恶劣天气等具有挑战性的场景中实现准确和稳健的性能。因此,RGBT跟踪近年

### RGBT 跟踪技术概述 RGBT跟踪是一种融合可见光(RGB)和热成像(Thermal Infrared, TIR)数据的计算机视觉方法。该技术通过结合两种模态的信息来提高目标检测和跟踪性能,尤其适用于复杂场景下的应用[^1]。 #### 技术背景与挑战 在计算机视觉领域,单一传感器的数据往往难以应对复杂的环境条件。例如,在低光照条件下,RGB相机的效果会显著下降;而在烟雾、灰尘或其他遮挡物存在的情况下,热成像可能更有效。因此,RGBT跟踪旨在利用两者的互补特性,克服各自单独使用的局限性。然而,这种跨模态融合也带来了新的挑战,包括但不限于: - **特征表示差异**:RGB图像通常具有丰富的纹理细节,而热成像则更多关注温度分布,两者之间的语义差距较大。 - **噪声干扰**:不同传感器可能会引入不同的噪声模式,这增加了算法设计的难度。 - **计算成本**:实时处理双模态输入需要高效的模型架构和优化策略。 #### 当前研究进展 近年来,随着深度学习的发展,基于卷积神经网络(CNNs)的方法逐渐成为主流。这些方法可以分为两类:早期融合和晚期融合。前者是在较低层次上将两个模态的数据结合起来,后者则是分别提取各自的特征后再进行决策级融合[^1]。 一种典型的实现方式如下所示: ```python import torch from torchvision import models class RGVTTracker(torch.nn.Module): def __init__(self): super(RGVTTracker, self).__init__() self.rgb_branch = models.resnet18(pretrained=True) self.tir_branch = models.resnet18(pretrained=True) def forward(self, rgb_input, tir_input): rgb_features = self.rgb_branch(rgb_input) tir_features = self.tir_branch(tir_input) fused_feature = torch.cat((rgb_features, tir_features), dim=1) output = self.fusion_layer(fused_feature) # 假设有一个融合层 return output ``` 此代码片段展示了一个简单的双分支结构,其中每个分支负责处理对应的模态数据,并最终在一个高层次上完成特征融合。 #### 数据集与竞赛支持 Anti-UAV比赛中的RGBT Tracking赛道提供了一定规模的真实世界数据集,这对于验证新提出的算法非常有价值。具体来说,2020年的赛事作为首届活动,吸引了大量研究人员参与并提交方案[^1]。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值