人脸检测——MTCNN

最新推荐文章于 2025-10-08 15:15:04 发布

原创最新推荐文章于 2025-10-08 15:15:04 发布 · 7.4w 阅读

·

15

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

人脸检测(目标检测) 专栏收录该内容

20 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

本次介绍一篇速度还不错的人脸检测文章：

《2016 Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》.

源代码作者刚刚公布，效果相当不错（只有测试代码）：
https://kpzhang93.github.io/MTCNN_face_detection_alignment/index.html?from=timeline&isappinstalled=1

另外一位同学实现的MTCNN基于MXNET的训练代码，工作比较完整，参考价值比较大： https://github.com/Seanlinx/mtcnn

—————— Pipeline——————

JDA Pipeline

上面是该方法的流程图，可以看出也是三阶级联，和我之前的一篇博文CascadeCNN很像。

stage1: 在构建图像金字塔的基础上，利用fully convolutional network来进行检测，同时利用boundingbox regression 和 NMS来进行修正。（注意：这里的全卷积网络与R-CNN里面带反卷积的网络是不一样的，这里只是指只有卷积层，可以接受任意尺寸的输入，靠网络stride来自动完成滑窗）

stage2: 将通过stage1的所有窗口输入作进一步判断，同时也要做boundingbox regression 和 NMS。

stage3: 和stage2相似，只不过增加了更强的约束：5个人脸关键点。

————— Network —————

Stage1: Proposal Net

JDA Network1

Stage2: Refine Net

JDA Network2

Stage3: Output Net

JDA Network3

由上可以看出，其网络结构较CascadeCNN略深但每层参数较少，所以该方法性能较好同时速度和CascadeCNN也相差无几。

补充：

(1) 文中训练使用了Online Hard sample mining策略，即在一个batch中只选择loss占前70%的样本进行BP;

(2) 不同阶段，classifier、boundingbox regression 和 landmarks detection在计算Loss时的权重是不一样的；

(3) 训练数据共4类，比例3:1:1:2，分别是negative，IOU<0.3; positive,IOU>0.65; part face,0.4

—————— Result ——————

在FDDB上的表现：

JDA Network3

速度表现，CPU约15FPS

JDA Network3

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成

Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型，相比 3.0 版本，它提升了图像质量、运行速度和硬件效率

评论 32

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。