本次介绍一篇来自微软的人脸检测文章:
《2016 ECCV Supervised Transformer Network for Efficient Face Detection》.
核心导读:
(1) 训练了一个端到端的级联网络;
(2) 引入了supervised transformer层,可以对候选窗口进行矫正以便后续更好地判断是否为人脸;
(3) 引入了Non-top K的抑制策略,在保证召回率的同时也不会有精度损失;
(4) 引入了ROI卷积策略,可以加速运算。
评价:
检测性能基本属于公开方法的第一梯队(ROC曲线约0.9),速度基本是第一梯队里面最快的,达到CPU上30FPS。(恕我直言,就本文方法的工作量而言,30FPS估计是一个很难复现的数字)
—————— Network Architecture ——————
先来一个overview:
由上图可以看出共包含2个阶段:
(1) 第一阶段主要是mult

本文介绍了微软的一项研究,提出了一种名为Supervised Transformer Network(STN)的端到端人脸检测方法。该网络包括multi-task RPN、Supervised Transformer Layer、Non-top K抑制策略和ROI卷积,旨在提高检测性能和效率。STN通过学习关键点和模板,消除姿态和尺度变化的影响,同时采用Non-top K策略平衡召回率和精度。实验表明,该方法在保持高检测性能的同时,速度达到CPU上的30FPS。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



