An Asymmetric Distance Model for Cross-View Feature Mapping in Person Reidentification

本文提出了一种非对称距离模型,称为CVDCA,用于解决不同摄像头视角下的行人重识别问题。通过学习特定于摄像机视图的投影,该模型能将特征转换为公共空间,减少特征差异。此外,还引入了交叉视图一致性正则化来约束不同视图投影的差异,提高匹配性能。实验表明,这种方法在行人重识别任务上优于对称模型和其他远程学习方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Chen Y C, Zheng W S, Lai J H, et al. An Asymmetric Distance Model for Cross-view Feature Mapping in Person Re-identification[J]. IEEE Transactions on Circuits & Systems for Video Technology, 2016, PP(99):1-1.

摘要

         在非重叠相机视图中匹配相同身份的人物图像的人员重新识别成为交叉相机视图活动分析的重要组成部分。大多数(如果不是全部)行人再识别算法是基于外观特征设计的。然而,在动态的光照变化下,外观特征在非重叠相机视图中不稳定,并且这些算法假设通过探索稳健和不变特征或通过学习匹配距离可以很好地表示同一人的两个交叉视图图像。这种假设忽略了在具有不同相机特性和环境的不同相机视图下捕获图像的性质,因此,在不同视图下提取的特征之间大多存在大的差异。为了解决这个问题,我们制定了一个非对称距离模型,用于学习特定于摄像机的投影,以将每个视图的不匹配特征转换为一个公共空间,在该空间中提取跨视图空间的辨别特征。进一步引入了交叉视图一致性正则化来模拟不同摄像机视图的视图特定特征变换之间的相关性,这反映了它们的自然关系并且在避免过度拟合中起重要作用。还提出了核交叉视图判别分量分析。已经进行了大量实验以显示非对称距离建模对于行人再识别是重要的,其与交叉不相交视图匹配的关注相匹配,与六个公开可用数据集上的相关远程学习方法相比报告了优越的性能。

1、介绍

       如今,摄像机网络已广泛部署在机场,火车站和医院等公共基础设施中进行监视。由于经济问题,摄像机视图之间总是存在不重叠的区域。然后,挑战跟踪人员和非重叠摄像机网络上的活动预测。因此,当他/她再次出现在另一个摄像机视图中时,重新识别目标人物是至关重要的。这样的问题被称为行人重识别。然而,行人的外观会在摄像机视图中发生显著变化,因为环境和摄像机方向可能完全不同。有两个主要的特征差异问题:1)视角差异和2)行人方面的差异。视角差异是由环境变化引起的,例如照明和相机的白平衡,行人方面的差异是由行人自己造成的,例如背包或拉链夹克,以及显著的姿势变化[见图2(a)和(b)]。减轻非重叠相机视图中的外观变化包括:1)寻求有辨别力和鲁棒的图像描述符[2] - [4]; 2)学习可靠的距离/子空间模型[5] - [9]; 3)预处理模型,如直方图均衡[2],[3]和亮传递模型[10] - [12]。前两种方法隐含地假设可以选择一组不会发生显著变化的特征。然而,由于室内/室外照明和姿势变化,外观可能会发生很大变化。因此,来自不同相机视图的同一人的图像将看起来非常不同。尽管远程学习方法试图选择对这些变化具有鲁棒性的特征,但是大多数这些特征是基于外观提取的,尤其是颜色特征[13],其将在很大程度上受到照明或相机特性(例如,白平衡)的影响。然而,现有的使用远程学习进行行人重识别的方法都集中在对称建模上,即大多数都是基于任意两个样本之间的以下距离形式。

其中,半正定矩阵M被分解成对称建模本质上假设相同的特征变换应用于所有摄像机视图,这忽略了由在不同摄像机视图下捕获的图像的不同性质引起的特征差异。 由于视图和行人方面的差异导致非重叠相机视图中存在特征差异问题,因此现有距离/子空间学习方法中的常规单一投影矩阵学习[5] - [7],[16] - [21] 可以丢弃那些具有较大差异的特征,这些特征在交叉视图匹配期间可能具有区别性。 第III-A节将提供此分析的详细信息。

       在本文中,我们提出了一种用于行人重识别的非对称距离模型,即,我们概括了(1)中的对称形式,并通过考虑基于以下不对称形式的模型来考虑视图标签:

其中,p和q是两个不同摄像头视角下的标签,总有本质上讲,我们通过学习形成对称学习,我们称之为交叉视角变换。我们假设人们可以寻找一个潜在的共同空间,使得同一个人的不同摄像机视图中提取的特征变得更加相似,同时对于不同的人,它们变得更加不同。 基于这个假设,我们开发了一种有监督的非对称距离学习模型。 我们还观察到,尽管在不相交的摄像机视图中存在差异,但是由于存在相同的人匹配并且可能类似的室内/室外环境,因此在任何两个摄像机视图捕获的内容之间可能存在关系。因此,在特征转换之间的差异可以被控制。为此,我们在交叉视图模型中引入了交叉视图一致性正则化,以约束视图特定投影的差异,从而隐含地将交叉视图图像之间的关系嵌入到距离学习模型中。 基于以上思想,我们开发了一种新的人员重新识别的交叉视图匹配算法,称为交叉视图判别分量分析,如图1所示。

        总之,本文做出了以下贡献。

       1)我们提出并开发了一种新的非对称距离学习模型,称为CVDCA算法,将不同视图下的特征转换为行人重识别的公共空间。 所提出的方法通过视图特定映射来解决特征差异问题,并通过一致性正则化来模拟不同视图的相关性。我们还通过实验证明这种非对称距离模型比对称模型执行得更好。

     2)线性CVDCA进一步扩展到内核版本,然后提出核化CVDCA。

       已经进行了大量实验以证明所提出的CVDCA和核交叉视图判别成分分析(KCVDCA)可以更好地解决行人重识别中的特征差异问题。

2、近期工作

略....

3、方法

A 不同摄像头视角的特征差异

    让我们考虑一个一般情况:这有N(大于等于2)个摄像头存在有意义的特征差异

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值