博主最近主要关注使用深度学习的视频跟踪一系列算法,本文为学习笔记,仅供学习交流,如有侵权,请指出。
原文:https://zhuanlan.zhihu.com/p/22334661
No Free Lunch
不同于检测、识别等视觉领域深度学习一统天下的趋势,深度学习在目标跟踪领域的应用并非一帆风顺。其主要问题在于训练数据的缺失。深度模型的魔力之一来自于对大量标注训练数据的有效学习,而目标跟踪仅仅提供第一帧的bounding-box作为训练数据。
接下来,介绍几种思路来解决上述数据缺少的问题。
一、利用辅助图片数据预训练深度模型,在线跟踪时微调
在目标跟踪的训练数据非常有限的情况下,使用辅助的非跟踪训练数据进行预训练,获取对物体特征的通用表示(general representation ),在实际跟踪时,通过利用当前跟踪目标的有限样本信息对预训练模型微调(fine-tune), 使模型对当前跟踪目标有更强的分类性能,这种迁移学习的思路极大的减少了对跟踪目标训练样本的需求,也提高了跟踪算法的性能。
DLT(NIPS2013)
Learning a Deep Compact Image Representation for Visual Tracking