论文阅读:Neural Aggregation Network for Video Face Recognition

本文介绍了微软亚研院在CVPR2017发表的Neural Aggregation Network(NAN),该网络采用注意力机制对视频中的人脸进行加权融合,以减少计算量并确保输出特征与输入人脸数量和顺序无关。NAN由传统特征提取网络和注意力网络组成,通过级联的注意力块学习人脸集合的综合特征,并采用对比损失进行训练。实验结果显示在IJB-A和YTF数据集上的优秀性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Title:

Neural Aggregation Network for Video Face Recognition,微软亚研院CVPR2017的paper,实现的是利用一个attention机制对输入的一个set的人脸进行加权,得到一个人脸的特征。

作者:

URL:

https://arxiv.org/abs/1603.05474

Motivation:

希望输入一个set的人脸,输出是一个融合后的特征,而不是每一帧都计算一个特征(降低计算量)。另外,希望输出的特征和人脸set的输入数量和顺序无关。

方法:

作者提出Neural Aggregation Network(NAN)分为一个传统的feature提取网络和一个attention网络。attention模块给feature加权。

Feature提取网络是任意一个baseline。Attention模块希望学习一个向量q:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值