【2019IJCV】
Wu, Shuzhe, Meina Kan, Shiguang Shan, and Xilin Chen. “Hierarchical Attention for Part-Aware Face Detection.” International Journal of Computer Vision 127, no. 6-7 (2019): 560-578.
任务:人脸检测
问题:现在对整个特征图使用同样的卷积核或pooling层,会导致对于不同的候选区域同等对待,而且对于同一候选区域中的不同部分也同等对待
概述
本文研究的任务的人脸检测,其认为以前的方法对整张输入图像的不同位置及每个候选区域的不同部位使用同样的卷积核方法,没有对每个位置进行有针对性地考虑,因此提出了层级注意力方法。
模型首先使用Faster RCNN提出候选区域,对于每个候选区域分为mxn个局部区域,先使用基于高斯核的part-specific注意力机制来得到每个局部的特征,再使用基于LSTM的face-specific注意力机制来得到每个局部特征的关注权重,最终再使用局部特征来进行分类和定位。
损失函数使用分类的交叉熵损失和定位和平滑L1损失。
模型结构
先使用Faster RCNN的RPN获得候选区域,再对每个候选区域使用层级注意力机制来进行进一步判断和定位。
层级注意力机制由Part-specific和face-specific两部分组成,前者决定局部特征长什么样,后者觉得每个局部特征的重要性,层级注意力机制的输出再经过FC最终获得