非重叠相机下的面部重识别技术解析
1. 引言
人员重识别旨在判断不相交的视场(FoV)中是否观察到已在其他视场检测到的特定人员。它既可以在事件发生后通过处理存储的视频和(或)图像来执行,例如用于了解某人之前的行踪;也可以实时进行,即当人员穿过视频监控系统的相机网络时。
人员重识别是许多关键应用(如公共安全、多相机跟踪和法律取证搜索)的重要任务。然而,由于人类姿态、视角、光照、遮挡、服装和背景杂乱等未知变化,不同位置相机视图中人员的视觉外观可能会发生显著变化,这使得重识别任务极具挑战性。
重识别任务需要对数字图像进行人员检测、跟踪、合成和匹配。计算机视觉是一种可行的技术,因为它可以以离散、远程和非侵入的方式提供人员图像。合成和匹配是成功重识别的关键任务,需要合成视场中人员的不同视图以生成描述符,并通过比较描述符来确定对应关系。
描述符可以基于多种线索生成,如面部、人体全身图像、行走模式(步态)、身高和体型以及头部、躯干和四肢等。虽然人体的整体视觉外观在人员重识别中应用最广泛,但面部可以实现离散、远程和非侵入的重识别,并且在较长时间内能够实现稳定的重识别。因此,本文提出使用相关滤波器来合成视场中检测到的面部图像,以进行重识别。
2. 相关工作
现有的重识别方法主要集中在开发鲁棒的描述符,以捕捉不同相机视图中人脸的不变外观。可以利用面部的全图像或从其中提取的一组特征来实现这一目标。
重识别中的一个重大挑战是类别不平衡。在某些视场中,感兴趣人员的面部图像数量可能会被其他人员的面部图像数量所超过。使用不平衡数据设计的两类分类系统往往更容易识别样本数量最多的类别。渐进式提升(PBoost)学习算法可以解决这个