【多目标跟踪论文阅读笔记——2021年CVPR论文粗读记录】

最新推荐文章于 2024-10-04 15:34:51 发布

原创

最新推荐文章于 2024-10-04 15:34:51 发布 · 1.3w 阅读

133 ·

CC 4.0 BY-SA版权

文章标签：

#目标跟踪 #计算机视觉 #人工智能

[阅读心得] 多目标跟踪经典论文——2021CVPR论文粗读记录

前言
一、学习策略类
- QDTrack
二、Temporal-Spatial 类
- TADAM
- Alpha-Refine
- TraDes
- CorrTracker
三、Motion-model 类
- Track Management & Occlusion Handling
- ArTIST
四、Siamese-based类
五、Graph-based类
- LPC
- GMTracker
六、BenchMark类
- CroHD
- DroneCrowd
- GMOT-40
七、多模态类
- MM-DistillNet

前言

日志：
12月15日：按照魏师兄的指导，逐步阅读2021年CVPR跟踪相关论文，粗读第一遍并整理其创新点、实现方法和诠释在此，争取3天内读完至少10篇。
12月16日：整理粗读完3篇，发现transformer机制的重要性，明天赶紧精读一下！
12月17日：整理粗读完1篇，学transformer，沐神讲的太好了，强烈推荐链接
12月18日：整理粗读完2篇
12月19日：学习了ViT，对视觉transformer理解提升
12月20日：精读了TransTrack，笔记链接
12月21日：整理粗读完2篇
12月22日：整理粗读完2篇
12月23日：整理粗读完1篇，精读了Trackor++（笔记链接）
12月24日：修电脑，停了一天
12月25日：整理粗读完3篇，只剩下2篇BenchMark类文章，就全部读完了！！明天一并弄完。
12月27日：哈哈哈再一次食言了，又拖了一天弄完，并且将论文按照主要改进依据进行了分类，方便后面查找，本文基本完成，下周目标读完自动驾驶领域相关论文并整理，留坑

一、学习策略类

QDTrack

[论文]Quasi-Dense Similarity Learning for Multiple Object Tracking
[代码]https://github.com/SysCV/qdtrack

在这里插入图片描述

创新点： 提出了一种多正样本的相似度学习方法，以此增强模型的区分特征(REID)能力，进而提升总体的跟踪性能。且本方法能够实现端到端训练，简化了训练过程。推理速度很快，在MOT17上可以达到FPS20+。
为什么： 作者认为目前MOT领域对目标外形特征的利用程度不够，只使用了稀疏的Ground True框来训练分辨外形特征，导致了学习效果不够令人满意。
怎么做： 首先，设计了一种学习规则，让更多样本投入外形网络(REID)的学习过程中，通过加大考虑的样本数量，提供了更多的正样本和困难负样本(hard negative)，从而提高了外形特征的学习能力。此外，为了适应新的外形特征模型，在associate阶段设计了一种新的距离衡量方法Bi-direction Softmax，取代了之前用的余弦距离(Cosine)

二、Temporal-Spatial 类

TADAM

[论文]Online Multiple Object Tracking with Cross-Task Synergy
[代码]https://github.com/songguocode/TADAM
在这里插入图片描述
创新点： 在Trackor++的基础上，提出了一种同时增强位置预测和特征关联的模型，面对遮挡情况是具有更强的鲁棒性。此外，位置预测和特征关联的功能在此模型中是相互促进的，而不像先前工作中是分离的。在public detector下达到了SOTA的效果。
为什么： 作者提出目前提升DBT范式下跟踪主要有两个方向：一是增强位置检测、二是增强数据关联，但是之前的工作往往只进行一个方面或者两方面独立进行，作者通过举例论证了这样带来的提升是有限的，而二者应该相辅相成。
怎么做： Trackor++的position prediction基础上，考虑到同一目标在t帧时应用t-1的bbox进行回归时，框内可能遮挡物占主要，所以利用Target Attention模块和Distractor Attetion模块提取纯净的目标特征，保证bbox回归的准确性，减小飘逸。同时，采用特定的refference管理方法配合使用。