论文:Deep Face Recognition: a Survey

地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8614364
文章主要有5个部分:
(a)目前的方法怎么训练的,介绍一些公共数据集;
(b)脸部预处理,包括检测和对齐;
(c)迁移学习所用的结构和损失函数;
(d)用于确认和鉴定的脸部识别。
任务的困难因素有:头部的旋转和倾斜、光照强度和角度、面部表情、年龄等方面的巨大变化。所以,一个好的面部识别系统需要排除这些因素的影响。

(a)训练过程&数据集介绍
在这里插入图片描述
文中的描述是:给定一个训练集,该方法通常执行某种形式的人脸预处理,然后训练一个DCNN,以便对一组对象进行分类。然后,利用网络作为特征提取器,获取描述符,并将描述符匹配在一起进行人脸识别。
介绍了一些数据集:
在这里插入图片描述

(b)脸部预处理和对齐
在这里插入图片描述
脸部对齐的目的是为了补偿脸部空间变化带来的不良影响。

(c)网络架构,损失函数和解纠缠
提到了一些比较常见的架构,比如VGG16,ResNet50等,这些是在其他非人脸数据集上面进行了旨在目标识别的预训练。
为了更好地处理位姿变化,研究者们尝试修改DCNN架构:Cao等人[60]利用等变映射的特性在编码器的最后阶段提出了一种新的块。提出的DREAM block在特征表示中加入残差,将轮廓面映射回标准姿态,以简化分类。

形如
在这里插入图片描述
交叉熵损失可以保证类间差距,但是无法使得类内差距最小化,所以提出了一些改进。比如 中心损失,L2约束的SoftMax,环损失,投影法等减小类内方差的方法。除此之外,也有加大类间差距的方法。上述损失解决了判别表示学习的大部分问题,缺点是它们参数化了网络内的训练对象。所以它们只适用于小规模的数据,在大规模的数据上就得牺牲batchsize。

为了增加训练规模,需要进行多层SoftMax,或者不考虑损失而进行内积比较。深度度量学习,如对比损失、双边缘对比损失或三联损失,允许训练规模很大。双联损失如下所示,就是我们之前所见的暹罗网络比较相似性的损失。可以将相似的和不相似的配对之间的距离分别控制到各自的边缘附近。
在这里插入图片描述
三联损失要求相似对距离小于不相似对的距离。
在这里插入图片描述
解纠缠是数据增强的一个代替手段。数据增强是有意地将其他因素注入像素空间,而解纠缠则是将特征空间中的因素解耦;这意味着,在习得表征中出现的唯一因素是同一性(相似性),没有其他混杂因素(姿势、表情、光照)的影响。
Peng将编码器分成两部分来达到解纠缠:一部分开发身份特征,另一部分使用非身份标签进行监督。
Liu使用自动编码器提取身份信号,并通过对抗性训练消除其他因素。
也有跟GAN联合在一起使用的。

(d)脸部识别
如第一张图所示,将卷积网络作为编码器,得到特征空间的表达之后,对欧氏距离进行余弦相似度比较。
介绍了一些将卷积网络的编码结果用于最终脸部识别的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值