基于face_recognition提取人脸嵌入向量进行人脸识别

引言

在当今数字化时代,人脸识别技术已经广泛应用于各个领域,如安防监控、门禁系统、人脸支付等。Python 中有许多强大的库可以帮助我们实现人脸识别功能,其中 face_recognition 库以其简单易用和高效的特点受到了广大开发者的喜爱。本文将详细介绍如何使用 face_recognition 库提取人脸嵌入向量,并基于这些向量进行人脸识别。

项目背景


face_recognition号称是世界上最简单的开源人脸识别库,可以通过Python或命令行识别和操作人脸。face_recognition提供了十分完整的技术文档和应用实例,人脸识别初学者建议研究该库上手。face_recognition的官方代码仓库为:face_recognition。face_recognition也有自己的官方中文文档,该文档详情见:face_recognition中文使用说明

face_recognition中的人脸识别模型来自开源的机器学习库Dlib,Dlib的官方代码仓库见:dlib。大部分模型用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。Labeled Faces in the Wild是美国麻省大学安姆斯特分校(University of Massachusetts Amherst)制作的人脸数据集,该数据集包含了从网络收集的13,000多张面部图像。该数据集算是一个非常小型的人脸数据集。

总体而言这个项目的人脸识别模型是基于成年人的,在孩子身上效果可能会一般,如果需要更多了解请参考博客:
[深度学习] Python人脸识别库face_recognition使用教程_人脸识别,特征库-优快云博客

假设我们有一个包含大量人脸图片的文件夹,我们希望对这些图片进行处理,提取每张图片中的人脸嵌入向量,并将处理后的图片和嵌入向量保存下来。同时,如果在处理过程中出现错误(如未检测到人脸、无法提取嵌入向量等),需要记录相应的错误信息。

实现步骤

1. 环境准备

首先,我们需要安装所需的库。可以使用以下命令进行安装:

pip install opencv-python
pip install face_recognition
pip install tqdm

这些库分别用于图像处理、人脸检测和特征提取以及进度条显示。

2. 代码实现

import os
import cv2
import time
import face_recognition
import shutil
import pickle
from tqdm import tqdm

# 输入文件夹路径
input_folder = input("请输入输入文件夹的路径: ")
# 输出文件夹路径
output_folder = input("请输入输出文件夹的路径: ")
# 错误日志文件路径
error_file = os.path.join(output_folder, "error.txt")
# 嵌入向量保存文件路径
embeddings_file = os.path.join(output_folder, "face_embeddings.pkl")

# 创建输出文件夹
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# 用于保存图片 ID 和对应嵌入向量的字典
face_embeddings = {}

# 检查嵌入向量文件是否存在,如果存在则加载已有数据
if os.path.exists(embeddings_file):
    with open(embeddings_file, "rb") as f:
        face_embeddings = pickle.load(f)

# 获取已经处理过的图片 ID
processed_ids = set(face_embeddings.keys())

# 获取输入文件夹中的图片文件列表
image_files = [filename for filename in os.listdir(input_folder) if filename.lower().endswith(('.png', '.jpg', '.jpeg'))]

# 过滤掉已经处理过的图片
unprocessed_files = [filename for filename in image_files if os.path.splitext(filename)[0] not in processed_ids]


def process_image(filename):
    image_path = os.path.join(input_folder, filename)
    img_id = os.path.splitext(filename)[0]  # 获取图片的唯一 ID
    try:
        start_time = time.time()
        # 读取图片
        img = cv2.imread(image_path)

        # 使用更高效的人脸检测模型(可选)
        # 这里使用 'hog' 模型,速度相对较快,但精度可能略低
        face_locations = face_recognition.face_locations(img, model='hog')
        print(f"\n正在处理 {filename}: 检测到的人脸数量 ==> {len(face_locations)}")

        if len(face_locations) == 0:
            with open(error_file, "a") as error_log:
                error_log.write(f"{img_id}: No face detected.\n")
            return None

        # 提取人脸嵌入向量
        face_encodings = face_recognition.face_encodings(img, face_locations)

        if len(face_encodings) == 0:
            with open(error_file, "a") as error_log:
                error_log.write(f"{img_id}: Failed to extract face embeddings.\n")
            return None

        # 复制原始图片到输出文件夹
        output_path = os.path.join(output_folder, filename)
        shutil.copyfile(image_path, output_path)

        print(f"{filename} 的人脸识别检测时间: {time.time() - start_time:.2f} 秒")

        return img_id, face_encodings

    except Exception as e:
        with open(error_file, "a") as error_log:
            error_log.write(f"{img_id}: Error occurred - {str(e)}\n")
        return None


# 处理未处理的图片
for filename in tqdm(unprocessed_files, desc="正在处理图片", unit="张"):
    result = process_image(filename)
    if result is not None:
        img_id, face_encodings = result
        face_embeddings[img_id] = face_encodings

# 将嵌入向量字典保存到文件
with open(embeddings_file, "wb") as f:
    pickle.dump(face_embeddings, f)

print("处理完成。")

3. 代码解释

3.1 路径设置和数据加载

通过 input 函数让用户输入输入文件夹和输出文件夹的路径,同时设置错误日志文件和嵌入向量保存文件的路径。如果嵌入向量文件已存在,则加载其中的数据。

3.2 图片筛选

获取输入文件夹中的所有图片文件列表,并过滤掉已经处理过的图片,只处理未处理的图片。

3.3 图片处理函数 process_image

该函数用于处理单张图片,具体步骤如下:

  • 读取图片。
  • 使用 face_recognition.face_locations 函数进行人脸检测,这里使用 'hog' 模型,速度相对较快,但精度可能略低。
  • 如果未检测到人脸,将错误信息记录到错误日志文件中。
  • 提取人脸嵌入向量,如果无法提取,同样记录错误信息。
  • 将原始图片复制到输出文件夹。
  • 返回图片 ID 和人脸嵌入向量。
3.4 处理未处理的图片

使用 for 循环依次处理未处理的图片,并使用 tqdm 库显示处理进度。

3.5 保存处理结果

将处理后的图片的 ID 和人脸嵌入向量保存到 face_embeddings 字典中,并使用 pickle 库将字典保存到文件中。

总结

通过上述步骤,我们可以使用 face_recognition 库提取人脸嵌入向量,并将处理后的图片和嵌入向量保存下来。这些嵌入向量可以用于后续的人脸识别任务,如人脸匹配、人脸分类等。同时,代码中记录了错误信息,方便我们进行调试和排查问题。

需要注意的是,face_recognition 库的 hog 模型速度较快,但精度可能略低。如果对精度有较高要求,可以考虑使用 cnn 模型,但处理速度会较慢。此外,在处理大量图片时,可以考虑使用多进程或多线程来提高处理效率。

希望本文对你理解和使用 face_recognition 库进行人脸识别有所帮助,下一期我们来做人脸比对来获取同一个人的不同图片。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值