Haar cascade训练人脸小模型做人脸辨别

最新推荐文章于 2025-04-29 10:53:34 发布

之群害马

最新推荐文章于 2025-04-29 10:53:34 发布

阅读量395

点赞数 4

文章标签：音视频 opencv 计算机视觉

本文链接：https://blog.youkuaiyun.com/Ppandaer/article/details/142886515

版权

代码讲解

1. 导入必要的库

import cv2
import os
from pathlib import Path
import shutil
import numpy as np
import logging

cv2: OpenCV 库，用于图像处理和计算机视觉。
os: 提供了一种便携的方式使用操作系统依赖的功能。
pathlib.Path: 提供了对象导向的路径处理方法。
shutil: 提供了高级文件操作，如复制、移动文件等。
numpy: 用于处理数组和矩阵的计算。
logging: 提供了记录日志的功能。

2. 设置日志

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

设置日志的基本配置，使得程序可以记录信息级别的日志。

3. 加载 Haar cascade 模型

face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

加载 OpenCV 预训练的 Haar cascade 分类器，用于检测图像中的人脸。

4. 定义文件夹

REFERENCE_DIR = "reference"
NO_MATCH_DIR = "no_match"
os.makedirs(REFERENCE_DIR, exist_ok=True)
os.makedirs(NO_MATCH_DIR, exist_ok=True)

定义参考图像文件夹和不匹配图像的存放文件夹，并确保这些文件夹存在。

5. 加载训练数据集

training_data = []
labels = []

def load_training_data(training_dir):
    label = 0  # 假设只有一个参考人物
    for root, _, files in os.walk(training_dir):
        for file in files:
            if file.endswith(".jpg") or file.endswith(".png"):
                path = os.path.join(root, file)
                image = cv2.imread(path, cv2.IMREAD_GRAYSCALE)  # 直接读取为灰度图
                if image is not None:
                    training_data.append(image)
                    labels.append(label)

遍历指定的训练数据文件夹，加载所有 .jpg 和 .png 图片，并将它们转换为灰度图存储在 training_data 列表中，标签统一为 0（假设只有一个参考人物）。

6. 训练人脸识别器

def train_recognizer(training_data, labels):
    recognizer = cv2.face.LBPHFaceRecognizer_create()
    recognizer.train(training_data, np.array(labels))
    return recognizer

使用 Local Binary Patterns Histograms (LBPH) 方法训练人脸识别器。

7. 检测图像中的人脸

def detect_faces(image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    face_rects = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
    return face_rects

检测传入图像中的人脸位置，并返回人脸矩形框。

8. 识别图像中的人脸

def recognize_face(recognizer, image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 确保图像为灰度图
    face_rects = detect_faces(image)
    if len(face_rects) > 0:
        for (x, y, w, h) in face_rects:
            roi_gray = gray[y:y+h, x:x+w]  # 使用灰度图
            label, confidence = recognizer.predict(roi_gray)
            return label, confidence
    return None, None

使用训练好的人脸识别器来识别图像中的人脸，并返回标签和置信度。

9. 处理单张图片

def process_image(png_file, recognizer, threshold=100):
    try:
        image = cv2.imread(str(png_file))
        if image is None:
            raise FileNotFoundError(f"Could not load image from {png_file}")
        
        label, confidence = recognize_face(recognizer, image)
        if label is not None and confidence < threshold:
            logging.info(f"{png_file.name} belongs to the target person.")
        else:
            logging.info(f"{png_file.name} does not belong to the target person.")
            destination = Path(NO_MATCH_DIR) / png_file.name
            shutil.move(str(png_file), str(destination))  # 移动不匹配的图片
    except Exception as e:
        logging.error(f"Error processing {png_file.name}: {str(e)}")

处理单张图片，识别其中的人脸，如果识别结果的置信度低于阈值，则移动该图片到 NO_MATCH_DIR 文件夹。

10. 处理文件夹中的所有 .png 图片

def process_images(directory, recognizer):
    directory_path = Path(directory)
    png_files = list(directory_path.glob('*.png'))
    
    for png_file in png_files:
        process_image(png_file, recognizer)

遍历指定目录下的所有 .png 文件，并逐一处理。

11. 主程序入口

if __name__ == "__main__":
    # 加载训练数据集
    load_training_data(REFERENCE_DIR)
    
    # 训练人脸识别器
    recognizer = train_recognizer(training_data, labels)
    
    # 处理目标文件夹中的图片
    input_directory = 'images'  # 请确保这个路径是正确的
    process_images(input_directory, recognizer)