这篇文章来自ECCV2018. 主要针对无监督的行人再识别任务,首先用3D引擎和环境渲染技术构建了一个多光照条件的虚拟行人数据集,接着用该合成数据集和其它大型真实数据集合并,共同预训练了一个模型。由于涵盖了各种光照情况,该模型具有良好的泛化性能。为了进一步提升无监督性能,该文章提出了一种域自适应技术(有约束的cycleGAN),选择和目标域的光照情况最相似的那些合成图像,迁移到目标域上,再利用迁移后的合成图像对预训练好的模型进行精调,最终大幅提升了reid的性能,超过其它无监督方法。
一. 摘要
跨监控摄像头的剧烈光照变化会使得行人再识别任务变得非常困难。当前的大型reid数据集有着非常多的行人训练样本,但是缺乏光照的多样性。因此,如果遇到没有见过的光照条件,一个训练好的模型需要进行精调才能变得有效。为了解决这个问题,本文引入了一个包含了上百种光照条件的合成数据集。具体地说,我们使用了100个虚拟人物,利用多个HDR环境图对其进行照明,从而准确建模出真实的室内和户外光照。为了在没见过的光照条件下取得更好的性能,我们提出一种新的域自适应技术,以一种完全无监督的方式利用了我们的合成数据并进行了精调。我们的方法和其它半监督和无监督方法相比,取得了很高的准确率,可以和有监督方法媲美。
二. 贡献
1.提出了一个新数据集,它包含了100个虚拟人物,并使用了140个HDR环境图进行渲染。我们展示了即使不经过fine-tuning,这个数据集也能够增强训练好的模型的泛化性能。
2.我们使用了一种新的三步式的域自适应技术,以无监督的方式提升了reid的性能。具体的说,我们使用了循环一致性迁移(cycleGAN),并增加了一个新的正则项以保证迁移前后行人身份信息不丢失。针对某一目标域迁移后的合成图像被用来fine-tune模型。
三. SyRI Dataset
要收集和标注一个涵盖所有光照条件的reid数据集的成本过高,因此本文提出采用合成数据集。构建这样一个数据集的难点在于如何创造出真实的光照条件的真实场景。我们使用高动态范围(HDR)环境图,它们可以看作是360度的真实世界的全景图,包含了准确

最低0.47元/天 解锁文章
1476

被折叠的 条评论
为什么被折叠?



