1、主要贡献
提出了一种基于图像帧及图像序列的表情识别架构,在性能相当的情况下,极大减少了卷积核个数,缓解了实验参数存储问题;提出了一种混合光照增强方案,缓解了训练过程中的过拟合问题;收集了三个表情识别数据集,推动了表情识别技术落地于便携式设备。
2、实现过程
图1. 基于图像帧的表情识别方案整体架构
图2. 基于图像帧的表情识别方案卷积神经网络详情
图3. 基于图像序列的表情识别方案总体结构
注意问题:
人脸检测与定位采用 CVPR2013:Supervised descent method
and its applications to face alignment中的方法,预处理后图像的尺寸统一为120x120。
为降低卷积神经网络中的参数,图2中前两个卷积核个数可均降低为16个,后两个卷积核的个数可均降低为32个,其识别率略微下降,但变化不大,但参数个数大规模减少。图2中PReLU就是指的ReLU。
基于图像序列的表情识别方案中的卷积神经网络采用图2所示结构,Gated Recurrent Unit 就是采用经典的GRU算法,包含128个隐层和一个softmax层。
混合光照增强方案取现有方案histogram equalization 和 linear mapping的线性加权,实验中权重均取0.5。
3、结论
表情数据库CK+下性能对比
CVPR2018论文 A Compact Deep Learning Model for Robust Facial Expression Recognition
最新推荐文章于 2021-02-20 10:51:36 发布