【Person Re-ID】Beyond Part Models: Person Retrieval with Refined Part Pooling

最新推荐文章于 2023-02-23 22:17:10 发布

转载最新推荐文章于 2023-02-23 22:17:10 发布 · 1.4k 阅读

文章标签：

#深度学习 #re-id

Person Re-ID 专栏收录该内容

13 篇文章

订阅专栏

转载地址：https://zhuanlan.zhihu.com/p/31947809

论文链接：Beyond Part Models: Person Retrieval with Refined Part Pooling

当前利用 part-level feature 做re-id 的方法大致分为两类：

1. 利用在其他数据集上训练好的 pose estimation 模型 unsupervised transfer 到 re-id 数据集上得到 local part 的定位，然后基于local parts 提取 part-level features。

2.不使用额外的类似于 pose estimation 的模型，而是用统一的分块方式，（比如给定一张行人图像，将图像均匀分割为固定的p个horizontal stripes）或者采用 attention 机制去locate 等。

使用第一种方法虽然可以显式的定位 local parts，但是也要忍受 transfer 过程由于 datasets bias 引入的误差。当然如果定位带来的提升大于引入误差导致的性能降低，整体也是可以接受的。这篇文章第一部分PCB模型属于第二类方法，使用得是均匀划分。对不同part用不同loss去训练。对于均匀分割或者其它统一的分割，不同图像在同一part可能因为没有对齐出现不同的语意信息。对此，作者提出了Refined Part Pooling 对统一分割进行提纯，增强 within-part 的一致性，这也是本文的一大亮点。

Method

PCB结构：

去掉Resnet50 global average pooling及以后的部分。
将最后一层feature map 分成 p个horizontal stripes。分别对p个horizontal stripes做global average pooling就得到了p个局部特征。
因为 Resnet50 最后一层feature map的通道数为2048，作者又用1x1 conv将其降到256维。
接着用p个n（训练集ID数目）分类softmax作为分类器进行训练。损失函数使用交叉熵损失。
测试时分别串联向量g和h作为行人图像的特征表示。