- 博客(2)
- 收藏
- 关注
原创 MTCNN细节
1.MTCNN细节本节将从训练与预测两个阶段分别解析MTCNN的细节。1.1训练过程训练的输入为什么不需要使用图像金字塔?答:首先明确图像金字塔的作用:P-Net的输入为1212,而图像中人脸一般大于1212,那么P-Net根本不能进行预测,图像金字塔的作用就是缩放原图像使得大一点的人脸缩小到1212以下。而我们预先准备的训练集(随机在标注好的图像上进行裁剪,保存成1212的大小。裁剪后的图像,根据IOU,划分成负样本、正样本、部分样本),保证了12*12的框中包含人脸。P-Net、R-Net、
2020-08-11 00:11:14
511
原创 YoLov3细节
本文基于: https://github.com/YunYang1994/tensorflow-yolov3.对YoLov3的原理及trick做一个总结。1.多尺度feature map输入图像经过Darknet-53后得到三个分支,并经过upsampling、concat等操作得到 [13, 13, 255]、[26, 26, 255] 和 [52, 52, 255]三尺度的feature map。其中255=3x(1+4+80)(3—每个grid cell有三个anchor,即每个grid cell
2020-08-06 12:17:08
381
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人