Horizontal Pyramid Matching for Person Re-ID

该博客探讨了行人再识别任务中的挑战,提出了一种创新的模型,即水平金字塔匹配(Horizontal Pyramid Matching)。该模型利用pyramid structure结合maxpooling和avgpooling,有效地处理图像中部分身体缺失的问题,提高了特征提取的鲁棒性。实验表明,这种多尺度的分割和混合池化策略优于单一尺度方法,增强了局部和全局信息的捕获能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

行人再识别问题

行人再识别是一项很具有挑战性的任务,主要因素包括环境因素和行人本身的因素:

(1)环境因素:复杂的背景、光照、获取的图像分辨率等;

(2)行人因素:衣着、姿势、步态等。

之前很难提取到robust的特征,深度学习的发展使特征提取成为可能。

 

论文方法

[主要思想]

使用多个尺度,将提取到的特征图进行水平划分成bins;将每个bin分别进行平均池化和最大池化,并将两个池化结果整合起来:每个尺度的不同bin池化结果可以连在一起,用作分类。参考下图:

[模型框架]

(1)backbone: 使用resnet50从输入图像提取特征图;使用ImageNet的预训练权重;与resnet50不同在于:conv4_1的步长由2改成1,并且去掉平均池化层和全连接层。

(2)horizontal pyramid pooling: 首先根据scale水平划分特征图:分别进行最大池化和平均池化,两者结果对应相加;通过1*1的卷积核进行降维。

(3)fc + softmax: 使用全连接层和softmax进行分类。

详情见下图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值