论文解读:
Abstract
本文解决问题:人脸的尺度变化、姿态、遮挡、表情、外观和光照。本文提出了一种新的人脸检测网络——DSFD,它继承了SSD的结构,引入了一个特征增强模块(FEM),将原始特征映射转换为特征增强模块(FEM),将单次检测器扩展为双次检测器。–重点是准和全,不是快。另外还改进了锚匹配(IAM)方法,将新的数据增强技术和锚设计策略集成到我们的DSFD中,为回归器提供更好的初始化。在流行基准上的广泛实验:WIDER FACE(容易:0:966,中等:0:957,困难:0:904)和FDDB(不连续:0:991,连续:0:862)表明DSFD优于最先进的人脸检测器(如PyramidBox和SRN)。
Introduction
真实场景中,多尺度、姿态、遮挡、大表情、光照等仍然存在很多挑战。
目前人脸检测存在的问题:
(1).特征学习
当前使用广泛的FPN只聚合了高输出层和低输出层之间的层次特征映射,没有考虑当前层的信息,忽略了锚之间的上下文关系。***–FPN也聚合多层的信息,为啥说没有呢?***
(2).Loss函数设计
目前损失函数多数是区域回归损失和分类损失。解决分类不均衡问题,使用的Focal loss,用于难分样本上。为了使用所有原始的和增强的特性,Zhang等人提出了分层损失来有效地学习网络。但是上述损失函数并没有考虑不同层次特征图的渐进学习能力。***–你说啥就是啥吧。***
(3).Anchor匹配
通常Anchor设定,是在不同的特征图上设置一系列不同比例和长宽比的框。但是实际中,连续的人脸尺度和大量离散的anchor对于正anchor和负anchor仍然有较大的比值差异。
为了解决以上问题&#