[论文笔记]K-CRC for Person Re-ID

本文介绍了K-CRC算法,一种基于跨视图协作表示的人脸重识别方法。它通过使用多任务学习框架,在不同摄像头视角下同时计算协作表示,提高了识别效果。与DVDL算法相比,K-CRC在字典使用、距离度量、表示类型及应用场景等方面有所不同。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

[论文笔记]K-CRC算法

Kernel Cross-View Collaborative Representation based Classification for Person Re-Identification(2016 ArXiv)


1. SRC & CRC

这个问题源自ICCV2011上一篇人脸识别的论文Sparse Representation or Collaborative Representation: Which Helps Face Recognition?

SRC(Sparse representation based classification)首先用所有训练样本的线性组合表示一个测试样本,然后估计哪一类可以最小化representation error,就确定了测试样本属于哪一类。很多相关工作都强调了sparse representation在人脸识别的作用,但是文章研究发现,是Collaboration representation而不是l1-norm Sparsity使得SRC在人脸识别方面更有效。

文章认为SRC算法中,有两点很关键:
- 第一,测试样本的编码矢量必须是稀疏的;
- 第二,测试样本由整个样本数据库协作编码表达,而不是由每个类别的子集表达。

假如测试样本属于样本数据库中的某一类,那么应该可以有这个类别的样本集稀疏表示,也就是用最少的样本来表达,所以测试样本的编码矢量必须是稀疏的。但是这是建立在每个类别的样本集都是完备的,这个基础上的,实际上这样的前提很难做到。用某一类别的样本集来表达测试样本的误差会很大,即便是测试样本恰好属于这个类别。所以SRC采用整个样本数据库来协作表达测试样本,当采用CRC(Collabarative representation based classification)判断测试样本是否属于某一类别时,既要判断测试样本与这一类别的差别是否小,还要判断与其他类别的差别是否大,这样的“double check”使得识别更加有效和鲁棒。

简明区分可见如下的目标方程:

mina||YXα||22+λ||α||p

当p=1时,a为sparse representation;当p=2时,a为collaborative representation。

2. Multi-task learning framework

求collaborative representation因子 ax ay ,y表示probe样本,x表示gallery样本,分别用两个独立的字典。

除了使用CRC,该算法的一大创新点是使用了multi-task learning framework,把不同摄像头视角下的collaborative representation的运算看成是一个不同的任务,同时计算ax和ay。

3. Comparison with DVDL-algorithm

与 ICCV2015上字典学习的论文Person Re-Identification with Discriminatively Trained Viewpoint Invariant Dictionaries 比较可以总结如下:

(a)X-CRC方法对不同摄像机视角使用不同的字典而使用DVDL 算法中使用统一的字典,且前者在式(3)中对字典Dx和Dy做了非线性的映射;
(b)编码向量的距离X-CRC方法中使用cosine距离而DVDL 算法使用欧式距离;
(c)X-CRC使用l2-norm(collaborative representation),DVDL使用l1-norm(sparse representation);
(d)X-CRC用于single-shot场景,DVDL用于multi-shot。

目录


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值