跨数据集行人重识别:SimPGAN模型的原理与实践
1. 跨数据集行人重识别问题
在行人重识别(Person Re-ID)领域,传统方法通常在一些公共标注数据集(记为 $\Omega_s$)上进行监督学习,训练出分类器 $C$。然而,当将训练好的分类器 $C$ 直接应用到从大规模相机网络收集的真实世界未标注目标数据集 $\Omega_t$ 时,由于 $\Omega_s$ 和 $\Omega_t$ 之间存在显著差异,性能往往不佳。如何有效地将在小标注源数据集上训练的分类器迁移到另一个未标注目标数据集,是该领域面临的基本挑战。
2. 解决方案思路
目前主要有两种解决跨数据集行人重识别的思路,如下表所示:
| 解决方案 | 思路 |
| ---- | ---- |
| 增量优化分类器 | 基于目标数据集的未标注数据,逐步优化分类器,使其适应目标域的数据。 |
| 转换目标域数据 | 将目标数据集的数据进行转换,使其适应预训练的分类器。 |
3. SimPGAN模型概述
为了解决上述挑战,提出了基于生成模型的解决方案——相似性保留生成对抗网络(SimPGAN)。该模型的核心思想是将目标数据集的数据进行转换,以适应预训练的分类器,而不是逐步优化分类器来适应新数据。图像转换需要满足以下两个约束条件:
- 数据适配性 :目标数据集中转换后图像的视觉特征应符合源数据集的特征分布,更适合在源数据集上预训练的视觉分类器。
- 相似性保留 :包含同一人的转换后图像的相似度应尽可能高。
SimPGAN模