【论文阅读】Deep multi-path convolutional neural network joint with salient region attention for facial。。。

该博客介绍了深度学习在面部表情识别中的应用,特别是DAM-CNN(Deep Attention Mechanism Convolutional Neural Network)模型。通过结合VGG-Face、Salient Region Detection (SERD)和Multi-Path Variational Autoencoder (MPVS-Net)三个部分,网络能够学习到关键区域的重要性并忽略冗余特征。VGG-Face提取特征,SERD生成权重掩膜,MPVS-Net则学习深层次的泛化特征,以提高识别准确性。实验结果显示,该模型在处理表情识别时能有效考虑个体差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文阅读笔记

引言

引言部分其实没说什么,就提了一句:如果我们用权重去衡量 “每个patch” 或 “某些区域”在表情识别任务中的重要性的话会更好。比如微笑表情其实和嘴角区域的关系更大,可以给这个区域赋予更高的权重;额头区域在微笑表情的判别任务中似乎没有太重要,所以可以给这个区域赋予更低的权重。

网络结构

网络结构分为3部分:VGG- Face、SERD、MPVS-Net。
首先上两个网络整体图
在这里插入图片描述
在这里插入图片描述

接下来介绍每个部分的功能:
(1)VGG- Face:16层卷积层、5个池化层、三个全连接层。本文用微调后的VGG- face作为主干网络来提取特征,特征输出维度为512 * 7 * 7

(2)SERD:先上图,结合图来介绍
在这里插入图片描述

SERD接收VGG- Face输出的特征图作为输入,然后生成一张权重掩膜,说白了就是用一层卷积层(对!SERD只是一层卷积操作!)卷积VGG- Face的输出,然后再用tan

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值