Title:
Neural Aggregation Network for Video Face Recognition,微软亚研院CVPR2017的paper,实现的是利用一个attention机制对输入的一个set的人脸进行加权,得到一个人脸的特征。
作者:
URL:
https://arxiv.org/abs/1603.05474
Motivation:
希望输入一个set的人脸,输出是一个融合后的特征,而不是每一帧都计算一个特征(降低计算量)。另外,希望输出的特征和人脸set的输入数量和顺序无关。
方法:
作者提出Neural Aggregation Network(NAN)分为一个传统的feature提取网络和一个attention网络。attention模块给feature加权。
Feature提取网络是任意一个baseline。Attention模块希望学习一个向量q: