行人重识别(Person Re-idenfication,Person ReID)是判断图像或者视频序列中,是否存在特定行人的技术,也称跨境追踪技术。尽管人脸识别技术已经十分成熟,但在人群密集、监控摄像头分辨率低、拍摄角度较偏等情况下,人脸无法被有效识别。行人重识别变成了重要补充。
Multiple Granularity Network (MGN)是1个将全局信息和各粒度局部信息结合的端到端特征学习策略。

论文地址:https://arxiv.org/pdf/1804.01438
项目地址:https://github.com/GNAYUOHZ/ReID-MGN
目录
一.方法
1.网络结构
MGN的网络机构如下图所示。

输入图像尺寸:384*128,每个mini-batch选取P=16个人,每个人K=4张照片。
从resnet-50的res_conv4_2分为3个分支,提取全局和部分特征。
•global branch
在res_conv5_1中使用stride=2的卷积进行下采样,对得到的feature map采用global max pooling生成2048维的特征向量,并利用1*1的卷积压缩为256维的特征向量。
•Part-N Branch
Part-N Branch分支用于学习局部的特征表示,为了保留适合局部特征的感受野,没有使用下采样。通过在水平方向上均匀的将feature map划分为N块,并利用global max pooling和1*1卷积来得到对应的局部特征,N越大粒度越细。
Part-2 Branch分支中,N=2,可以理解为将行人分为上半身和下半身;Part-3 Branch分支中,N=3,可以理解为将行人分为上,中,下3个部分。
在测试的时候,将3个256维的全局特征向量和5个256维的局部特征向量concat起来得到的2048维向量作为行人的特征表示,用于相似性搜索。
2.Loss函数
将用于分类的softmax函数和用于度量学习的三元损失函数(triplet loss)用作训练过程中的损失函数。

最低0.47元/天 解锁文章
1403

被折叠的 条评论
为什么被折叠?



