基于流形嵌入和距离度量学习的头部姿态估计
1. 引言
头部姿态估计(HPE)是计算机视觉中的经典问题,它是多视图人脸识别系统、人机界面和其他人机交互应用的重要组成部分。然而,实现鲁棒且与身份无关的头部姿态估计仍然是一个具有挑战性的问题。
在高维特征空间中,具有不同姿态角度的人脸图像被认为位于一个平滑的低维流形上。基于降维的头部姿态估计方法旨在寻找一个低维连续流形,然后将新图像嵌入到这些流形中以估计姿态。经典的主成分分析(PCA)技术虽可用于寻找训练头部图像主成分构成的子空间,但不能保证该子空间与姿态变化的相关性高于外观变化。流形学习方法如局部保持投影(LPP)和局部嵌入分析(LEA)可直接学习嵌入,但如何提取有效的低维流形姿态特征并忽略身份、尺度、光照等外观变化仍是挑战。
为解决这些问题,本文提出了一种基于距离度量学习(DML)的流形嵌入方法。该方法先学习马氏距离度量,使具有相似流形的主体图像更接近,然后用此距离寻找主体构建最优嵌入。同时,提出了一种由姿态和身份信息监督的平滑且有判别性的嵌入方法,以提供比传统方法更好的类内紧凑性和类间可分性。
2. 基于DML和流形嵌入的姿态估计
2.1 动机
姿态图像因身份变化的改变通常大于同一主体不同姿态的改变,因此获取能保留姿态差异的与身份无关的流形嵌入至关重要。头部图像可通过高斯拉普拉斯(LoG)滤波器预处理以捕捉与姿态变化直接相关的边缘图,同时可利用身份和姿态信息去除嵌入过程中姿态数据的个体冗余。
本文方法基于两个观察:一是身份引起的外观变化会导致主体嵌入的平移、旋转和扭曲,相似个体外观的两个主体在局部线性嵌入(LLE)中几乎位于同一连续流形上;二是身份变化会影响学
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



