这篇文章是北邮的邓伟洪教授关于Deep Facial Expression Recognition,DFER的一篇综述性文章,该文章被计算机视觉顶会CVPR收录。
目前,FER(Facial Expression Recogniton)主要存在两个问题:一个就是缺少大量的数据来训练表情识别网络,一旦网络训练数据量过少,就会发生过拟合的现象,这点目前还没有有效的解决办法;另一个问题就是由于年龄、性别、道德背景等的差异,导致个体间的差异比较明显。除此之外,光照和姿态也会对FER产生较大的影响。
这篇文章详细介绍了解决FER目前存在的问题的一些方法。其中文章section1介绍了FER的发展历程,section2介绍了FER实验常用的数据集,section3介绍了FER系统识别的三个主要步骤,section4提供了一些主流的网络架构以及训练技巧,section5则讨论了一些其他相关的问题,section6主要论述了一下FER未来的挑战和机遇。下面以章节划分逐一介绍。
section2 FACIAL EXPRESSION DATABASES
该部分列举了FER可用的数据库。
主要有CK+、MMI、JAFFE、TED、FER2013、AFEW、SFEW、Multi-PIE、BU-3DFE、Oulu-CASIA、RaFD、KDEF、EmotionNet、RAF-DB、AffectNet、ExpW这些数据库。
section3 DEEP FACIAL EXPRESSION RECOGNITION
deep FER主要有三个步骤,预处理、特征学习、特征分类。
预处理
由于背景、光照、姿态等非相关因素的影响,在训练网络之前,需要进行一定的预处理,主要有人脸对齐和标准化。