多视角人脸正面化生成综述:Multi-view Frontal Face Image Generation: A Survey
本文首发于极市平台
作者:宁欣1,2,3,南方哲2,3,许少辉2,3,于丽娜1,张丽萍1,2,3
单位信息:1、中国科学院半导体研究所 高速电路与神经网络实验室,2、威富集团形象认知计算技术联合实验室,3、深圳市威富视界有限公司
论文下载地址:
https://www.researchgate.net/publication/347731732_Multi-view_frontal_face_image_generation_A_survey
摘要
不同视角的人脸图像降低了人脸识别的精度,人脸正面化图像生成是人脸识别领域中重要的研究课题。为深入了解人脸正面化生成模型的发展,把握当前研究的热点和趋势,针对现有基于3D模型、基于深度学习和基于混合模型的方法进行了归纳总结,介绍了现有人脸正面化生成常用的数据集,并通过实验对比分析现有模型的性能。其目的在于从本质上了解现有人脸正面化生成的优势; 对人脸正面化生成的关键问题进行梳理,并对未来的发展趋势进行展望。
0. 引言
多视角人脸正面化图像生成指从一个或多个视角的非正面图像生成正面化的人脸图像。正面化的人脸图像在人脸识别,视频监控,身份验证等方面有较广泛的应用,尤其是人脸识别领域。近年来,人脸识别技术得到了广泛的发展如人脸考勤,人脸侦察,人脸支付,随着机器学习和深度学习技术热潮,人脸识别的应用和准确率更是达到了一个较高的水准。然而由于非正面的面部识别纹理信息通常比正面面部识别性差、正面和侧面的共同特征非常有限、姿态变化会导致面部实质变形等原因,现有的许多人脸识别算法在大姿态的非正面人脸图像中识别人脸仍然是具有挑战性的问题,姿态问题也成了限制非受限环境下人脸识别效果的主要因素,因此如何从大姿态的非正面人脸图像中恢复出正面人脸图像是一项很有价值的研究。
目前,人脸正面化图像生成问题在国内外已经得到了广泛的研究,如Lee等利用特征空间中的线性变换在2004年和2006年结合主成分分析提出了生成正面视图图像的方法。2012年li Y等基于最小二乘法实现了人脸正面化转正。2005侯榆青等[14]利用边缘点集的协方差矩阵的特征值与特征矢量实现了人脸正面化图像的生成;李海彦等利用仿射变换和成像原理相结合对待识别的多姿态人脸图像进行姿态调整,将其调整为近似于正面人脸的方法;王科俊等结合图像旋转公式实现了人脸图像的平面旋转校正;上述传统的人脸正面化成技术主要是对不同姿态的人脸进行几何代数变换得到矫正后的正面人脸,这种基于几何代数变换的正面化生成方法计算简单快速,但是生成效果并不理想,会存在局部扭曲的问题,且有很大的局限性,只能解决小角度(小姿态)情况下的人脸正面化生成。随着3D模型的提出和深度学习的发展,一些研究者将3D模型和深度学习模型运用到了人脸正面化生成领域。基于此,本文将重点对近些年来基于3D模型和深度学习模型的人脸正面化生成方法的主要进展和部分具有代表性的研究成果进行介绍,并通过实验对比和分析,总结了人脸正面化生成研究中的难点和热点,以及可能的发展趋势。
1. 基于3D建模的人脸正面化生成模型
1.1 3D模型介绍
由于3D数据对视角变化天然的鲁棒性,基于3D的方法可以十分理想地解决正脸生成问题。其中三维形变模型(3D morphable model,3DMM) 是由Blanz等提出的一种人脸3D可变形的人脸模型,3DMM作为描述人脸形状的平均模型,是实现3D人脸重建和3D人脸识别常用的模型之一。该算法的思路是利用一个人脸数据库构造一个平均人脸形变模型,在给出新的人脸图像后,将人脸图像与模型进行匹配结合,修改模型相应的参数,将模型进行形变,直到模型与人脸图像的差异减到最小,然后对纹理进行优化调整,即可完成人脸建模。因此算法主要有两个步骤,第一步是从人脸数据库中所有脸构建出一个平均的脸部模型,第二步完成形变模型与照片的匹配。针对步骤一,首先将人脸分成两种向量:形状向量和纹理向量。形状向量S包含了X,Y,Z的坐标信息,定义如公式1所示,其中n表示模型的定点数:
纹理信息T包含了R,G,B颜色值信息,定义如公式2所示:
然后由m个脸部模型建立三维形变的脸部模型,其中每一个都包含相应的Si, Ti两种向量。新的三维形变脸部模型公式定义如下:
其中,m表示采集的人脸样本数,a和b为参数系数。
最后由公式(3)和公式(4)线性组合成新的脸部模型,如公式5所示:
针对步骤二,在形变模型的基础上,对于一张给定的人脸照片,首先将模型与人脸照片进行配准,然后对模型的参数进行调整,使其与照片中的人脸差异值达到最小即可,即模型