paper下载地址:https://arxiv.org/abs/1710.00478
Introduction
Person Re-ID目前依然是一项十分具有挑战的任务。姿势,视角,光照,背景和遮挡都给这项任务带来困难。
传统的方法通过学习low-level特征,比如颜色、外形、局部描述子等来描述一个人。而CNN通过学习high-level特征能够提升性能。目前的监督性学习方法能够分为两类,一类是表示学习,一类是度量学习。
- 表示学习:把ReID看为分类与识别任务。直接受益于常用的分类方法,比如softmax,因此很容易训练出来,性能也还不错。但是这类方法主要关心的是类与类之间的不相似性,忽略了pair之间的相似性,导致很难将同一个人的pairs和不同人的pairs区分开。
- 度量学习:直接评估两张图像embedding features的相似性。比如contrastive loss,triplet loss,improved triplet loss, quadruplet loss。尽管这些度量距离的loss对image pairs很敏感,也很难训练,但是性能却比表示学习要好。
本文中,作者提出了一种新的度量学习方法,称之为margin smaple mining loss(MSML)。在一个batch中,随机选取P个人的K张图像,总共N=P*K张,计算特征空间的N*N距离矩阵,选择距离最大的positive pairs和距离最小的negative pairs来计算最终的loss。
Method
Triplet loss
老生常谈的话题,直接上公式。
公式第一项表示要使得同类之间pairs越来越近,第二项表示不同类之间的pairs越来越远。这两项共用同一张positive image,即anchor,因此triplet los

本文探讨了行人重识别(Person Re-ID)的挑战,并对比了表示学习与度量学习方法。作者提出了一种新的度量学习损失函数——Margin Sample Mining Loss(MSML),该方法通过优化距离矩阵,选择最难的正负样本进行训练,提高了性能。实验表明,MSML在多数数据集上优于传统的Triplet和Quadruplet损失,但训练过程可能较慢。
最低0.47元/天 解锁文章
1108





