可扩展的行人重识别:超越监督式方法
1. 引言
行人跨摄像头重识别(re - id)在计算机视觉领域是极为重要的问题,它为大范围场景理解奠定了基础,而这个大范围通常会被多个摄像头覆盖。和多数识别问题类似,目前最成功的方法基于监督式训练阶段。利用跨摄像头对的标注数据来学习模型,这些模型能定义两个摄像头视图之间的转换关系,在测试阶段用于关联图像。
不过,这种高度监督的方式阻碍了问题的可扩展性。因为随着摄像头网络规模增大以及可能遇到的情况增多,需要标注的数据量也会随之增长。我们探讨能否在不牺牲性能的前提下,大幅降低行人重识别问题的监督程度,从而确保能将重识别问题扩展到更大的摄像头网络,同时不影响关联任务的准确性。具体考虑以下两个问题:
- 用于标注的最优子集选择 :给定跨摄像头网络的未标注训练数据和相似度度量,能否选出一个最小的图像子集进行标注,然后基于此学习行人重识别模型?如果能明智地选择这个最小子集,就可以利用相似度度量将标签传播到数据集的其他部分,这样大部分标签就能自动获取,只需标注一小部分图像。
- 通过迁移学习引入新摄像头 :能否利用已学习的重识别模型,在很少甚至无需额外监督的情况下,将新摄像头引入现有网络?基于迁移学习概念,我们可以为现有网络添加新摄像头。与完全监督式学习模型的方法相比,在这个扩展网络中,通过迁移学习过程,只需少量额外监督就能实现相近的性能。
第一个问题与行人数量增加时行人重识别的可扩展性相关,第二个问题与摄像头网络规模增大时的可扩展性相关。
2. 相关工作
- 监督式行人重识别
超级会员免费看
订阅专栏 解锁全文
850

被折叠的 条评论
为什么被折叠?



