目录
本文是 IJCV 2021 Intra-Camera Supervised Person Re-Identification 的论文笔记。参考我爱计算机视觉https://blog.youkuaiyun.com/moxibingdao/article/details/112792563
论文链接:https://arxiv.org/abs/2002.05046.
Background
什么是Re-ID?
行人重识别(Person re-identification,简称Re-ID)是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。
即给定一个监控行人图像,检索跨设备下的该行人图像。
如左图,对于某一感兴趣的行人c,依次经过camera a和camera b,而Re-ID的任务就是已知行人c在camera a下的图片,需要检索出该行人在camera b中出现的图片,或者说是否存在于b中。
实际生活中有许多不同视角不同位置的摄像头,通过Re-ID可以确定行人的行动路线和行动时间。
为什么要用Re-ID?
旨在弥补目前固定的摄像头的视觉局限,区分于人脸检测,不需要用户配合 去摆正脸或侧脸,而是在被检测方毫无察觉的情况下即可完成。并可与行人检测/行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。
Re-ID的五大步骤:
- 数据采集,一般来源于监控摄像机的原始视频数据;
- 行人框生成,从视频数据中,通过人工方式或者行人检测或跟踪方式将行人从图中裁切出来,图像中行人将会占据大部分面积;
- 训练数据标注,包含相机标签和行人标签等其他信息;
- 重识别模型训练,设计模型(主要指深度学习模型),让它从训练数据中尽可能挖掘“如何识别不同行人的隐藏特征表达模式”;
- 行人检索,将训练好的模型应用到测试场景中,检验该模型的实际效果。
Re-ID技术识别困难存在的挑战:
- 低分辨率导致的特征提取困难
- 目标遮挡导致部分特征丢失;
- 不同摄像视角造成行人外观的巨大变化;
- 不同的光照导致同一目标的特征差异;
- 不同目标衣服颜色近似、特征近似导致区分度下降。
Motivation
(a)行人重识别的挑战。每一个由虚线框包围的三元组都显示了一个人从不同相机视角拍摄的图像。
(b)跨镜头视图手动关联身份的说明。虚线箭头表示两个身份之间的比较。相同的身份以红框为界。
行人重识别考虑的是一个跨镜头关联目标人物的问题。对于传统的全监督行人重识别,为了训练得到一个性能较好的模型,大量标注好的行人数据是必不可少的。但是标注行人重识别数据是一个耗时又耗力的工作,这极大限制了在实际应用中的可扩展性。这也是此文的motivation之一。
针对这个问题,无监督(unsupervised)和跨领域无监督(unsupervised domain adaption)行人重识别算法在近几年得到了越来越多的关注也获得了很大的进步。但是相比于全监督行人重识别模型而言,无监督模型的性能依然有一定的差距。
基于这两个motivation,作者提出了一种在全监督和无监督之间的方法—摄像机域内监督行人重识别。这消除了最耗时、最繁琐的摄像头间身份标识过程,显著减少了人工标注的工作量。
Related Work
行人重识别领域的相关工作分为这几类:有监督、半监督、弱监督、无监督
当前的Re-ID模型大多是有监督的。
-
有监督:
用有标签的数据训练
优点:显著的性能提升
缺点:费时费力,限制实际生活的实用性和扩展性 -
半监督:
将有监督最小化的显著趋势是半监督。有一部分数据的标签未知。通常是两阶段的训练