CVPR2018论文 A Compact Deep Learning Model for Robust Facial Expression Recognition

本文提出了一个紧凑的深度学习模型用于鲁棒的面部表情识别,该模型在保持高性能的同时显著减少了卷积核数量,解决了参数存储问题。通过采用混合光照增强策略,有效防止了过拟合。此外,还介绍了数据集的收集,为表情识别技术在移动设备的应用奠定了基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、主要贡献
提出了一种基于图像帧及图像序列的表情识别架构,在性能相当的情况下,极大减少了卷积核个数,缓解了实验参数存储问题;提出了一种混合光照增强方案,缓解了训练过程中的过拟合问题;收集了三个表情识别数据集,推动了表情识别技术落地于便携式设备。
2、实现过程
这里写图片描述
图1. 基于图像帧的表情识别方案整体架构
这里写图片描述
图2. 基于图像帧的表情识别方案卷积神经网络详情
这里写图片描述
图3. 基于图像序列的表情识别方案总体结构
注意问题:
人脸检测与定位采用 CVPR2013:Supervised descent method
and its applications to face alignment中的方法,预处理后图像的尺寸统一为120x120。
为降低卷积神经网络中的参数,图2中前两个卷积核个数可均降低为16个,后两个卷积核的个数可均降低为32个,其识别率略微下降,但变化不大,但参数个数大规模减少。图2中PReLU就是指的ReLU。
基于图像序列的表情识别方案中的卷积神经网络采用图2所示结构,Gated Recurrent Unit 就是采用经典的GRU算法,包含128个隐层和一个softmax层。
混合光照增强方案取现有方案histogram equalization 和 linear mapping的线性加权,实验中权重均取0.5。
3、结论
表情数据库CK+下性能对比

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值