目 录
1.背景:
人类的面部表情是其最直接有效的情绪表达方式,针对表情识别技术的研究被认为是未来人机情感交互的主要发展方向[1]。美国的心理学家Ekman和Friesen经过大量的实验与测试后,将人类的表情定义为以下六类:生气(Angry)、厌恶(Disgust)、恐惧(Fear)、高兴(Happiness)、悲伤(Sadness)和惊讶(Surprise)[2]。实际情况下为了和无表情有所区分,一般还增加一类:正常(Neutral),共计7种基础表情,如图1所示。在这个人工智能技术成为热门的时代,人脸表情识别已成为其中的一项研究热点,而卷积神经网络、深度信念网络和多层感知器等端对端的算法在人脸面部表情识别领域的运用尤为广泛。
图1 常见的几种表情
目前,人脸识别( Facial Recognition, FR)精度已经超过人眼,人脸表情识别作为FR技术的一个重要组成部分,在计算机视觉、人机交互和情感计算中有着广泛的研究前景,包括人机交互、情绪分析、智能安全、娱乐、网络教育、智能医疗等。人脸表情识别的主要框架分为三个步骤:图像预处理、人脸检测和表情分类,如图2所示。
图2 人脸表情识别步骤
图片预处理实现了图片大小及色彩的调整,使计算机读入的图片更易被处理。通过图像的预处理,可以尽量消除光照、角度等无关因素对模型的影响。图片经处理后再输入模型进行训练,可大大提高模型识别的精确度。为了提高表情识别效果,首先需要确定人脸位置,人脸检测就是利用人脸检测算法,对图片进行多区域、多尺度的检测,最终得到一个或多个人脸所在的位置,以方便对该区域进行识别。
在表情识别的早期研究中,首先需要进行特征工程处理,然后利用分类算法进行表情分类。传统的特征提取方法,主要有局部二值模式(LBP)[3]、梯度方向直方图(HOG)[4]、Haar-like特征(Haar)[5]等。手工提取特征的方法对于简单问题能够快速解决,而对于复杂情况则有人工成本高、适应性差等问题。本文采用深度学习的方法,通过训练卷积神经网络构建表情分类模型,实现快速、准确的表情识别。</