基于opencv的人脸口罩识别

龙卷风~

于 2023-07-02 21:43:16 发布

阅读量311

点赞数 2

分类专栏： opencv 文章标签： python

本文链接：https://blog.youkuaiyun.com/weixin_52246128/article/details/131505784

版权

opencv 专栏收录该内容

1 篇文章

订阅专栏

该文介绍了如何下载和处理人脸口罩数据集，包括按比例获取正负样本，对数据集进行重命名以形成连续序列，调整正负样本的像素大小以优化模型训练，以及创建txt文件用于后续的模型训练。最后，文章提到了使用opencv_traincascade.exe进行模型训练的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、人脸口罩数据集下载处理

（一）人脸口罩数据集下载

下载人脸口罩数据集的目的是利用OpenCV进行模型训练，这里采用口罩数据集的正负比列为1:3，即500张戴口罩的人脸图片和1500张不戴口罩的人脸图片。
链接：百度网盘请输入提取码
提取码：n2um
解压之后，将压缩包中的mask文件自行选择文件夹放置，以便之后的操作。

（二）人脸口罩数据集的处理

1、将数据集重命名为连续序列
因为数据集中的图片序列是不连续的，因此这里需要编程将数据集的正负样本重命名为连续序列，以便像素调整。
重命名正样本序列Python代码：

#对数据集重命名
#coding:utf-8
import os
path = "D:\\facemask\\mask\\have_mask" #人脸口罩数据集正样本的路径
filelist = os.listdir(path)
count=1000 #开始文件名1000.jpg
for file in filelist:   
    Olddir=os.path.join(path,file)  
    if os.path.isdir(Olddir):  
        continue
    filename=os.path.splitext(file)[0]   
    filetype=os.path.splitext(file)[1]
 
    Newdir=os.path.join(path,str(count)+filetype)  
    os.rename(Olddir,Newdir)
    count+=1

命名之后，正样本序列如下：

重命名负样本序列Python代码：

#对数据集重命名
#coding:utf-8
import os
path = "D:\\facemask\\mask\\no_mask" #人脸口罩数据集的路径
filelist = os.listdir(path)
count=10000 #开始文件名1000.jpg
for file in filelist:   
    Olddir=os.path.join(path,file)  
    if os.path.isdir(Olddir):  
        continue
    filename=os.path.splitext(file)[0]   
    filetype=os.path.splitext(file)[1]
 
    Newdir=os.path.join(path,str(count)+filetype)  
    os.rename(Olddir,Newdir)
    count+=1

重命名之后，负样本序列如下：

2、正负样本数据集像素处理

正样本数据集的像素最佳设为20x20，这样的模型训练精度更高；负样本数据集像素不低于50x50，这样处理可以加快模型训练的速度。

修改正样本数据集像素为20x20Python代码：

#修改正样本像素
import pandas as pd
import cv2
for n in range(1000,1606):#代表正数据集中开始和结束照片的数字
    path='D:\\facemask\\mask\\have_mask\\'+str(n)+'.jpg'
    # 读取图片
    img = cv2.imread(path)
    img=cv2.resize(img,(20,20)) #修改样本像素为20x20
    cv2.imwrite('D:\\facemask\\mask\\have_mask\\' + str(n) + '.jpg', img)
    n += 1

修改像素之后，序列如下：

修改负样本数据集像素为80x80Python代码：

#修改负样本像素
import pandas as pd
import cv2
for n in range(10000,11790):#代表负样本数据集中开始和结束照片的数字
    path='D:\\facemask\\mask\\no_mask\\'+str(n)+'.jpg'
    # 读取图片
    img = cv2.imread(path)
    img=cv2.resize(img,(80,80)) #修改样本像素为80*80
    cv2.imwrite('D:\\facemask\\mask\\no_mask\\' + str(n) + '.jpg', img)
    n += 1

修改像素之后，序列如下：

3、创建正负样本数据集路径的txt文件
（1）创建正样本数据集txt文件
win+R打开窗口输入cmd，进入命令提示符界面，进入have_mask文件夹

输入命令创建路径文件

dir /b/s/p/w *.jpg > have_mask.txt

have_mask.txt文件位置在正样本数据集文件夹中

（2）创建负样本数据集txt文件（方法同正样本数据集一样）

然后将have_mask.txt和no_mask.txt文件放到mask目录下

（三）、算法实现

创建xml文件夹存放训练好的模型

将OpenCV安装路径 \opencv\build\x64\vc14\bin下的opencv_createsamples.exe可执行文件和opencv_traincascade.exe可执行文件及另外两个下图文件复制到数据集同级目录，如下所示：

2．对正负样本txt文档进行预处理

正负样本需要生成 .vec格式的文档进行模型训练，因此需要通过对txt文档进行预处理，向have_mask.txt文件中末尾加入 1 0 0 20 20。

正样本处理Python代码：

#正样本文件预处理没行目录结尾加入 1 0 0 20 20

#coding:utf-8
import os
#Houzui="_Apple"
Houzui=r" 1 0 0 20 20" #后缀
filelist = open('D:\\facemask\\mask\\have_mask.txt','r+',encoding = 'utf-8')
line = filelist.readlines()
for file in line:
    file=file.strip('\n')+Houzui+'\n'
    print(file)
filelist.write(file)
负样本处理Python代码：
#负样本文件预处理 没行目录结尾加入 1 0 0 60 60
#coding:utf-8
import os
#Houzui="_Apple"
Houzui=r" 1 0 0 80 80" #后缀
filelist = open('D:\\facemask\\mask\\no_mask.txt','r+',encoding = 'utf-8')
line = filelist.readlines()
for file in line:
    file=file.strip('\n')+Houzui+'\n'
    print(file)
    filelist.write(file)

这个处理不会自动覆盖之前的文件内容，所以需要手动将之前的内容剪切出来，保存为have_mask1.txt文件，have_mask.txt文件中只保留末尾为1 0 0 20 20的内容，如下：