OpenCV3计算机视觉Python语言实现人脸识别笔记

最新推荐文章于 2023-12-27 18:03:30 发布

女妖精老衲就是三藏

最新推荐文章于 2023-12-27 18:03:30 发布

阅读量3.6k

点赞数 6

分类专栏： OpenCV 文章标签： OpenCV3 人脸识别机器视觉 Python

本文链接：https://blog.youkuaiyun.com/rencia/article/details/79779365

版权

OpenCV 专栏收录该内容

1 篇文章

订阅专栏

本文记录了作者在学习OpenCV3中人脸识别章节遇到的问题，包括书本代码不完整、原版代码排版错误等。作者通过自行解决，分享了在32位系统上，使用Anaconda2、opencv3.0.0和Python2.7环境下，如何生成人脸识别数据的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

老衲最近在学习《OpenCV3计算机视觉Python语言实现》中文版，学到第五章人脸识别时懵逼了，书上代码都是片段，不会搞啊，不死心找了英文版官网的源代码，找了个遍，发现原版源代码排版错误，把第四章的代码贴到了第五章里。网上搜了一大圈，貌似各位大神都没怎么说到这章。肿么办，硬办。老衲来死磕，下面给出我的方法。老衲平板电脑是七彩虹的i818w，CPU是Z3735F，内存2G，32位操作系统。装了Anaconda2，opencv3.0.0，python是2.7。

第一步，生成人脸识别数据。还好这段代码比较全，也是正确的。

import cv2

def generate():
    # 老衲把脸的特征文件放在了C盘，用绝对路径调用，书上是相对路径，xml文件在opencv/sources/data/haarcascades里，拷到下面的路径里
    face_cascade = cv2.CascadeClassifier('C:\MyW\cascades\haarcascade_frontalface_default.xml')
    # 打开摄像头，老衲用的是7寸windows平板，带两个摄像头，1是前置，0是后置
    camera = cv2.VideoCapture(1)
    count = 0
    while (True):
        ret, frame = camera.read()
        # 作为初学者，老衲怀疑所有的新东西，print一下看看ret的输出
        print ret
        
        # 把摄像头的每一帧图像转换成灰度图像，这时书上就比较乱了
        # 有用cv2.cvtColor(frame, 1)也有用下面的，其实都一样
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 检测人脸，没好多说的，自己网上查大神们写的吧，不解释
        faces = face_cascade.detectMultiScale(gray, 1.3, 5)
        # 接下来就是循环保存图片了
        for (x, y, w, h) in faces:
            # 先画一个正方形，这很简单
            img = cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 0, 0), 2)
            
            # 接下来把图像全部格式化成200x200像素
            f = cv2.resize(gray[y: y+h, x:x+w], (200, 200))
            
            # 保存图片为opencv专用的*.pgm格式
            cv2.imwrite('C:\MyW\date\%s.pgm' % str(count), f)
            count += 1

        # 把咱们的老脸显示在camera名字的窗口里    
        cv2.imshow("camera", frame)
        # 这里就个人理解是图像每秒12帧，当按下q键时退出while循环
        if cv2.waitKey(1000 / 12) & 0xff == ord("q"):
            break
    # 释放摄像头句柄
    camera.release()
    # 销毁窗口，这句很重要，书上老漏导致老衲经常死机
    cv2.destroyAllWindows()

# 开始执行
if __name__ == "__main__":
    generate()

第二步，本着严谨的态度，老衲必须查看刚刚保存的人脸特征图，就是老衲的脸啦。用代码显示出来。

import cv2

# 打开C盘路径下保存图片的12.pgm文件，并保存为灰度图像
img = cv2.imread('C:\\MyW\\date\\12.pgm', cv2.IMREAD_GRAYSCALE)
# 顺便看看图片的格式，好大的一个列表对象，
# 里面的数组代表了图片上一个个行和列上的像素，格式是[xxx,xxx,xxx]
# xxx = 0~255
print img
# 在名为img的窗口上显示图片，像素为200x200
cv2.imshow('img',img)
cv2.waitKey()
cv2.destroyAllWindows()

第三步，上正菜，老衲觉得出版社太坑了，给了很多片段，还不给全部源代码，老衲一向自给自足丰衣足食，来看下面老衲整理的一大片代码。

#coding=utf-8
import os
import sys
import cv2
import numpy as np

# 图片的路径
filepath = 'c:\\MyW\\date\\'
# 定义2个数组，X存放每幅图片的数组列表，y存放每幅图片的序号，后面有句print函数
# 可以在IDLE里看哪张图片特征最匹配实时检测到的脸，并给出置信度
X = []
y = []

# 顾名思义，读取特征图片
def read_images(path):
    # 初始化计数器
    c = 0

    # 扫描路径下的路径名，文件名，不明白的可以在下面print一下
    for dirname, dirnames, filenames in os.walk(path):
        # print dirname, dirnames, filename
        # 提取每个文件并保存到X,y数组里，这里老衲做了点改动，应为老衲的特征图片路径没有书上代码那么深
        for filename in filenames:
            try:
                # 组合路径和文件名，得到特征图的绝对路径c:\MyW\date\1.pgm
                filename = os.path.join(path, filename)
                # 把特征图以灰度图读取
                im = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)

                # 重新格式化图片为200x200像素，原书估计打错字了
                if (im is not None):
                   im = cv2.resize(im, (200, 200))

                # 把特征图片数组添加到X数组中，组成一个大的特征数组
                X.append(np.asarray(im, dtype=np.uint8))
                y.append(c)
            # 输入输出错误检查
            except IOError, (errno, strerror):
                print "I/O error({0}): {1}".format(errno, strerror)

            except:
                print "Unexpected error:", sys.exc_info()[0]
                raise
            c = c + 1
    #print X
    #print y
    # 估计到这，这数组的维度大得吓人了
    return [X, y] 

# 顾名思义，人脸检测开始了
def face_rec():
    # 定义一个名字的数组，随便瞎打几个英文字母，等会下面会用到
    names = ['SHG', 'JSY', 'LYF']
    # 加载特征图片
    [x, y] = read_images(filepath)
    # 把y数组保存为int32格式的数组，用asarry()不用开辟新的内存，其实老衲觉得array()函数也可以，现在谁的电脑内存没个几G啊
    y = np.asarray(y, dtype=np.int32)
    # 加载EigenFaceRecognizer算法，这里必须改为EigenFaceRecognizer_create，原书createEigenFaceRecognizer
    # 因为老衲用的是opencv_contrib_python-3.4.0.12-cp27-cp27m-win32.whl
    # 如何安装contrib请各位施主自行百度，后面会讲一个老衲安装时碰到的小故事
    model = cv2.face.EigenFaceRecognizer_create()
    # 训练数据集，貌似机器学习，好高深，不深究
    model.train(np.asarray(X), np.asarray(y))

    # 和第一步里generate()里的用法一样，懒得解释了
    face_cascade = cv2.CascadeClassifier('C:\MyW\cascades\haarcascade_frontalface_default.xml')
    camera = cv2.VideoCapture(1)
    
    while (True):
        read, img = camera.read()
        faces = face_cascade.detectMultiScale(img, 1.3, 5)
        for (x, y, w, h) in faces:
            img = cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
            gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
            roi = gray[x: x+w, y: y+h]
            try:
                # 选出感兴趣的区域，使用内插法，还是老规矩自行百度
                roi = cv2.resize(roi, (200, 200), interpolation=cv2.INTER_LINEAR)
                # 预测实时图片，这里老衲也没看明白，下次有时间去看看EigenFaceRecognizer的方法
                params = model.predict(roi)
                # 把匹配的特征和置信度打印在IDLE内
                print "Label: %s, Confidence: %.2f" % (params[0], params[1])
                # 把匹配的名字显示在方框左上角，有时候会瞎显示，以后研究，还有就是现在无法显示中文字符，也以后吧 :P
                cv2.putText(img, names[params[0]], (x, y - 20), \
                            cv2.FONT_HERSHEY_SIMPLEX, 1, 255, 2)
            except:
                continue
        cv2.imshow("camera", img)
        if cv2.waitKey(1000 / 12) & 0xff == ord("q"):
            break
    cv2.destroyAllWindows()

if __name__ == "__main__":
    face_rec()

第四步，按F5运行，当当当当，老衲被照妖镜照出来啦，悟空，师傅不是妖精。

参考：1.《OpenCV3计算机视觉Python语言实现》作者：乔.米尼奇诺约瑟夫.豪斯
2. 《人脸识别经典算法实现（一）》作者：freedom098 点击打开链接