人脸识别

本文详细介绍了MTCNN人脸检测网络的三个核心组成部分:Proposal Network (P-Net),Refine Network (R-Net) 和 Output Network (O-Net)。通过边界框回归和非极大值抑制(NMS),这三个网络逐步精炼人脸区域候选,最终实现精确的人脸定位和关键点检测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

 

图像金字塔 https://blog.youkuaiyun.com/touch_dream/article/details/62419496

 

正如上图所示,该MTCNN由3个网络结构组成(P-Net,R-Net,O-Net)。

Proposal Network (P-Net):该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归,对候选窗口进行校准,然后通过非极大值抑制(NMS)来合并高度重叠的候选框。

Refine Network (R-Net):该网络结构还是通过边界框回归和NMS来去掉那些false-positive区域。

只是由于该网络结构和P-Net网络结构有差异,多了一个全连接层,所以会取得更好的抑制false-positive的作用。

Output Network (O-Net):该层比R-Net层又多了一层卷基层,所以处理的结果会更加精细。作用和R-Net层作用一样。但是该层对人脸区域进行了更多的监督,同时还会输出5个地标(landmark)。

 

 

- 人脸检测[数据下载](http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/)

- 人脸关键点[数据下载](http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm)

 

IOU:

 

 

 

 

 

(1) end 2 end : 128
(2) k-node 
(3) triplet loss 三元损失函数 距离是 什么 ?
(4) hard Triplet
(5) minibatch 选 negtive 样本 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值