【Person Re-ID】Person Re-Identification by Deep Learning Multi-Scale Representations

q295684174

于 2018-01-17 16:09:25 发布

阅读量2.1k

点赞数 2

分类专栏： Person Re-ID 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/q295684174/article/details/79085611

版权

Person Re-ID 专栏收录该内容

13 篇文章

订阅专栏

paper下载地址：http://www.eecs.qmul.ac.uk/~sgg/papers/ChenEtAl_ICCV2017WK_CHI.pdf

Introduction

本文主要的考虑是：目前所有re-id的方法，不管是不是基于CNN的，第一步都是将图像resize到统一大小然后再来提取特征。这种做法会模糊掉图像在不同尺度上的显著性特征，因此作者认为这样的方法不是最优的，本文提出了一种在多尺度上提取特征并且共同学习的方法，称之为DPFL（Deep Pyramidal Feature Learning）。

Approach

网络机构如下图所示：

这里写图片描述

Single Scale Feature Learning

作者使用的主网络是42层的Inception-V3，每个scale上都是用同样的网络结构进行softmax分类，得到每个scale上输入图像的分类概率 $\widetilde{P}=[\widetilde{p_{1}},...,\widetilde{p_{i}},...,\widetilde{p_{n_{id}}}]$ 。

Multi-Scale Consensus Learning

提取主网络最后一层卷积层的特征 $c*c*2048$ 维，然后加上averaging-pooling→vector concatenation→dropout得到2048*m维的向量，m为scale的个数。然后进行softmax分类，得到各个scale特征融合之后的分类概率 $P=[p_{1},...,p_{i},...,p_{n_{id}}]$ 。

Feature Regularisation by Consensus Propagation

用融合之后的分类概率给每个scale的loss加上一个正则项

这里写图片描述

其中

这里写图片描述

Discussion

DPFL与Knowledge Distillation (KD)的不同的点在于：

目标性：KD的目标是模型压缩，通过将一个学习得很好的很大的teacher模型转化为一个小的student模型。DPFL的共同学习是为了获得不同scale上图像的判别性描述。
动态性：KD需要一个预先训练好的teacher模型。DPFL则是用所有scale的输出生成teacher，然后用这个teacher约束每个scale的学习，是一个动态的过程。

Model Optimisation

从上面的学习过程可以看出这个网络的学习过程是有一定顺序的，作者给出的算法如下图所示：

这里写图片描述

总的来说就是前向时先每个分支学习，然后每个分支上加上正则项；反向时先每个分支更新梯度，然后融合的分支更新梯度。

Experiment

Evaluation on Market-1501

这里写图片描述

Generalisation to Different CNN Models

这里写图片描述

点评：本文的做法很新颖，虽然主要考虑的是scale因素，但是如果用在parts上的话感觉会更合适，下去尝试下。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。