Haar cascade训练人脸小模型做人脸辨别

代码讲解

1. 导入必要的库
import cv2
import os
from pathlib import Path
import shutil
import numpy as np
import logging
  • cv2: OpenCV 库,用于图像处理和计算机视觉。
  • os: 提供了一种便携的方式使用操作系统依赖的功能。
  • pathlib.Path: 提供了对象导向的路径处理方法。
  • shutil: 提供了高级文件操作,如复制、移动文件等。
  • numpy: 用于处理数组和矩阵的计算。
  • logging: 提供了记录日志的功能。
2. 设置日志
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

设置日志的基本配置,使得程序可以记录信息级别的日志。

3. 加载 Haar cascade 模型
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

加载 OpenCV 预训练的 Haar cascade 分类器,用于检测图像中的人脸。

4. 定义文件夹
REFERENCE_DIR = "reference"
NO_MATCH_DIR = "no_match"
os.makedirs(REFERENCE_DIR, exist_ok=True)
os.makedirs(NO_MATCH_DIR, exist_ok=True)

定义参考图像文件夹和不匹配图像的存放文件夹,并确保这些文件夹存在。

5. 加载训练数据集
training_data = []
labels = []

def load_training_data(training_dir):
    label = 0  # 假设只有一个参考人物
    for root, _, files in os.walk(training_dir):
        for file in files:
            if file.endswith(".jpg") or file.endswith(".png"):
                path = os.path.join(root, file)
                image = cv2.imread(path, cv2.IMREAD_GRAYSCALE)  # 直接读取为灰度图
                if image is not None:
                    training_data.append(image)
                    labels.append(label)

遍历指定的训练数据文件夹,加载所有 .jpg.png 图片,并将它们转换为灰度图存储在 training_data 列表中,标签统一为 0(假设只有一个参考人物)。

6. 训练人脸识别器
def train_recognizer(training_data, labels):
    recognizer = cv2.face.LBPHFaceRecognizer_create()
    recognizer.train(training_data, np.array(labels))
    return recognizer

使用 Local Binary Patterns Histograms (LBPH) 方法训练人脸识别器。

7. 检测图像中的人脸
def detect_faces(image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    face_rects = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))
    return face_rects

检测传入图像中的人脸位置,并返回人脸矩形框。

8. 识别图像中的人脸
def recognize_face(recognizer, image):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 确保图像为灰度图
    face_rects = detect_faces(image)
    if len(face_rects) > 0:
        for (x, y, w, h) in face_rects:
            roi_gray = gray[y:y+h, x:x+w]  # 使用灰度图
            label, confidence = recognizer.predict(roi_gray)
            return label, confidence
    return None, None

使用训练好的人脸识别器来识别图像中的人脸,并返回标签和置信度。

9. 处理单张图片
def process_image(png_file, recognizer, threshold=100):
    try:
        image = cv2.imread(str(png_file))
        if image is None:
            raise FileNotFoundError(f"Could not load image from {png_file}")
        
        label, confidence = recognize_face(recognizer, image)
        if label is not None and confidence < threshold:
            logging.info(f"{png_file.name} belongs to the target person.")
        else:
            logging.info(f"{png_file.name} does not belong to the target person.")
            destination = Path(NO_MATCH_DIR) / png_file.name
            shutil.move(str(png_file), str(destination))  # 移动不匹配的图片
    except Exception as e:
        logging.error(f"Error processing {png_file.name}: {str(e)}")

处理单张图片,识别其中的人脸,如果识别结果的置信度低于阈值,则移动该图片到 NO_MATCH_DIR 文件夹。

10. 处理文件夹中的所有 .png 图片
def process_images(directory, recognizer):
    directory_path = Path(directory)
    png_files = list(directory_path.glob('*.png'))
    
    for png_file in png_files:
        process_image(png_file, recognizer)

遍历指定目录下的所有 .png 文件,并逐一处理。

11. 主程序入口
if __name__ == "__main__":
    # 加载训练数据集
    load_training_data(REFERENCE_DIR)
    
    # 训练人脸识别器
    recognizer = train_recognizer(training_data, labels)
    
    # 处理目标文件夹中的图片
    input_directory = 'images'  # 请确保这个路径是正确的
    process_images(input_directory, recognizer)

主程序入口,加载训练数据集,训练人脸识别器,并处理指定目录下的所有图片。

总结

这段代码实现了从一个包含参考人物的图像文件夹中加载数据,训练一个简单的人脸识别器,然后用这个识别器去识别另一个文件夹中的图片,并将不匹配的图片移动到另一个文件夹中。通过这种方式,可以有效地对大量图片进行分类处理。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

之群害马

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值