Person Re-identification by Local Maximal Occurrence Representation and Metric Learning
- 提出了一个特征提取方法LOMO(local maximal occurrence),主要着眼于光照和视角问题。特征提取之前采用Retinex算法进行图像增强。特征表示采用HSV直方图和SILTP直方图
- XQDA(Cross-view Quadratic Discriminant Analysis)方法对空间进行降维和距离度量(学习降维矩阵)
- 一个降低 ∑ 计算复杂度的方法
文中提到的Retinex算法是一种常见的图像增强算法,假设我们所看到的颜色是由于物体反射红绿蓝三种光形成的,颜色不是由光照强度决定的而是由物体的反射能力决定的(颜色恒常在,不因为光发生变化)。Retinex可以在动态范围压缩、边缘增强和颜色恒常三个方面达到平衡,因此可以对各种不同类型的图像进行自适应的增强。详见http://blog.youkuaiyun.com/carson2005/article/details/9502053
在图像增强之后采用HSV颜色直方图来提取颜色特征,SILTP描述子来提取光照尺度不变的纹理特征,采用滑动窗口来描述局部细节。采用10X10,步长为5的窗口在整张图片中滑动。在每个子窗口中分别统计2个尺度的SILTP直方图和HSV直方图,每个直方图的bin表示该种模式出现的概率,为了弱化行人视角变化问题,对同一模式在同一水平位置的滑动窗口中取最大概率值作为最后的直方图值。
令 Δ=xi−xj 表示2个样本之间的特征差异,同类样本之间的差异 Δ 符合变量 ΩI 的高斯分布,异类样本之间的差异 Δ 符合变量 ΩE 的高斯分布,并且均值都为0。KISSME and Bayessian face
f(Δ)=lnP(Δ|ΩE)