人脸检测与特征描述是人脸相关项目应用的基础(包括人脸识别,人脸认证以及人脸聚类等)
本文以mtcnn与facent算法为基础,讲述怎样训练自己的人脸模型。
主题框架采用的是 facenet 源码,依据具体需求,对facnet做了一定的修改,facenet源码见
https://github.com/davidsandberg/facenet
1、数据集收集
由于目前开源的数据集中,大多数都是欧美人士的,直接用这些数据来训练的模型对亚洲人脸的泛化能力有限制。所以需要自己采集人脸数据集,这里主要采用是通过爬虫,爬取尚街拍(https://www.jiepai.net/)上的人物照片。
具体爬虫操作见以下博客的说明
https://blog.youkuaiyun.com/reset2021/article/details/119103008
https://blog.youkuaiyun.com/reset2021/article/details/119107894
最终爬取的数据形式如下