mtcnn 理解二

原创

于 2019-05-09 10:04:20 发布 · 2.6k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文深入解析MTCNN（Multi-Task Cascaded Convolutional Networks）人脸检测算法，包括其多任务学习机制、图像金字塔、边框回归等核心概念，并探讨了优化策略，如动态调整最小人脸尺寸和并行化处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考网址:http://www.sfinst.com/?p=1683

人脸检测，解决两个问题：1)识别图片中有没有人脸？2)如果有，人脸在哪？因此，许多人脸应用(人脸识别、面向分析)的基础是人脸检测。

大多数人脸检测采用的流程为两阶段：

1) 找出所有可能是人脸的候选区域

2) 从候选区域中选择出最可能是人脸的区域

本文的主角MTCNN，大致是这种套路，也集成了其优缺点为：准和慢。

MTCNN人脸检测是2016年的论文提出来的，MTCNN的“MT”是指多任务学习(Multi-Task)，在同一个任务中同时学习”识别人脸“、”边框回归“、”人脸关键点识别“。相比2015年的CVPR(边框调整和识别人脸分开做)的结构，MTCNN是有创新的。

参考的代码是David Sandberg的复现，

https://github.com/davidsandberg/facenet/blob/master/src/align/detect_face.py

该复现是github上MTCNN的复现中星星最多，实现得最像原作的版本。代码中包含着大量的Magic Number，初读，令人不知所云

预测过程:

step1: 第一阶段的目标是生成人脸候选框。MTCNN推断流程的第一阶段，蕴含了许多CNN的技巧，个人认为是比较精华也具有启发性的部分。并且MTCNN的推断过程中，第一阶段时间消耗占80%左右，所以如果需要优化和理解MTCNN的读者，在第一阶段投入再多精力都不为过。

1

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。