用于行人重识别的新型视觉词共现模型与联合学习方法
新型视觉词共现模型
在行人重识别领域,提出了一种新型视觉词共现模型。该模型的核心思想是,码词共现模式在图库/查询图像对中表现出相似且一致的特性,并且对图像的变化具有鲁棒性。
模型生成过程
- 对于一组码词切片,在每个码词切片的每个像素位置执行最大操作,以搜索切片中空间上最接近的码词。这个过程形成一个距离变换图像,进一步映射到空间核图像。这样可以使码词出现时的每个峰值平滑且均匀地传播。
- 为了计算码词共现的匹配分数,将查询图像和图库图像的空间核按元素相乘,然后对所有潜在位置求和。这一步确保描述符对码词图像中的噪声数据不敏感。这个值是描述符中用于索引码词共现的一个条目,用于匹配查询图像和图库图像。最终生成一个高维稀疏外观描述符。
graph LR
A[码词切片] --> B[最大操作]
B --> C[距离变换图像]
C --> D[空间核图像]
E[查询图像空间核] --> F[元素相乘]
G[图库图像空间核] --> F
F --> H[求和]
H --> I[匹配分数]
实验设置
- 数据集 :在两个基准数据集VIPeR和CUHK Campus上进行测试。对于每个数据集,将不同相机视角的图像分为图库集和查询集。查询集的图像作为查询,与图库集中的每个人进行比较。
超级会员免费看
订阅专栏 解锁全文
1190

被折叠的 条评论
为什么被折叠?



