利用Kinect进行RGB - D图像人脸识别
1. 引言
人脸识别是生物识别领域研究广泛的问题之一。在光照、姿态和表情等条件可控的受限环境中,自动识别算法的性能接近完美,但在不受限环境下,识别仍具有挑战性。传统的2D彩色图像用于人脸识别时,每张捕获的图像只能获取有限的面部信息。而3D图像虽能捕捉更多面部信息,在不受限条件下保留更高程度的面部特征,但专业3D传感器成本高昂,限制了其大规模应用。
近年来,传感器技术的进步催生了低成本的消费级RGB - D传感器,它能提供伪3D信息。典型的RGB - D图像由2D彩色图像(RGB)和深度图(D)组成。RGB图像呈现面部的纹理和外观,深度图则记录每个像素到传感器的距离,以灰度值形式编码面部几何形状。以Kinect为例,它由微软开发,原本用于视频游戏的动作和音频捕捉,也能捕获红外、深度、视频和音频数据。不过,Kinect提供的深度图不如专业3D传感器精确,存在孔洞和尖峰等噪声,因此现有的3D人脸识别方法可能无法直接应用于RGB - D图像。
2. 现有算法综述
2.1 基于判别颜色空间变换和稀疏编码的RGB - D人脸识别
- 预处理 :
- 从深度图中可靠检测鼻尖位置,以其为参考点,用半径8cm的球体在3D空间中裁剪面部。
- 利用公开数据集FRGC和UWA的图像定义128×128像素的参考人脸模型,通过迭代最近点(ICP)算法将人脸对齐到正面姿势。
- 利用人脸对称性处理深度数据中的噪声,进行对称填充和光滑重采样。
- 将RGB和深度矩阵从1
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



