OpenCV3计算机视觉Python语言实现人脸识别笔记

本文记录了作者在学习OpenCV3中人脸识别章节遇到的问题,包括书本代码不完整、原版代码排版错误等。作者通过自行解决,分享了在32位系统上,使用Anaconda2、opencv3.0.0和Python2.7环境下,如何生成人脸识别数据的步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

     老衲最近在学习《OpenCV3计算机视觉Python语言实现》中文版,学到第五章人脸识别时懵逼了,书上代码都是片段,不会搞啊,不死心找了英文版官网的源代码,找了个遍,发现原版源代码排版错误,把第四章的代码贴到了第五章里。网上搜了一大圈,貌似各位大神都没怎么说到这章。肿么办,硬办。老衲来死磕,下面给出我的方法。老衲平板电脑是七彩虹的i818w,CPU是Z3735F,内存2G,32位操作系统。装了Anaconda2,opencv3.0.0,python是2.7。

    第一步,生成人脸识别数据。还好这段代码比较全,也是正确的。

import cv2

def generate():
    # 老衲把脸的特征文件放在了C盘,用绝对路径调用,书上是相对路径,xml文件在opencv/sources/data/haarcascades里,拷到下面的路径里
    face_cascade = cv2.CascadeClassifier('C:\MyW\cascades\haarcascade_frontalface_default.xml')
    # 打开摄像头,老衲用的是7寸windows平板,带两个摄像头,1是前置,0是后置
    camera = cv2.VideoCapture(1)
    count = 0
    while (True):
        ret, frame = camera.read()
        # 作为初学者,老衲怀疑所有的新东西,print一下看看ret的输出
        print ret
        
        # 把摄像头的每一帧图像转换成灰度图像,这时书上就比较乱了
        # 有用cv2.cvtColor(frame, 1)也有用下面的,其实都一样
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        # 检测人脸,没好多说的,自己网上查大神们写的吧,不解释
        faces = face_cascade.detectMultiScale(gray, 1.3, 5)
        # 接下来就是循环保存图片了
        for (x, y, w, h) in faces:
            # 先画一个正方形,这很简单
            img = cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 0, 0), 2)
            
            # 接下来把图像全部格式化成200x200像素
            f = cv2.resize(gray[y: y+h, x:x+w], (200, 200))
            
            # 保存图片为opencv专用的*.pgm格式
            cv2.imwrite('C:\MyW\date\%s.pgm' % str(count), f)
            count += 1

        # 把咱们的老脸显示在camera名字的窗口里    
        cv2.imshow("camera", frame)
        # 这里就个人理解是图像每秒12帧,当按下q键时退出while循环
        if cv2.waitKey(1000 / 12) & 0xff == ord("q"):
            break
    # 释放摄像头句柄
    camera.release()
    # 销毁窗口,这句很重要,书上老漏导致老衲经常死机
    cv2.destroyAllWindows()

# 开始执行
if __name__ == "__main__":
    generate()
    第二步,本着严谨的态度,老衲必须查看刚刚保存的人脸特征图,就是老衲的脸啦。用代码显示出来。
import cv2

# 打开C盘路径下保存图片的12.pgm文件,并保存为灰度图像
img = cv2.imread('C:\\MyW\\date\\12.pgm', cv2.IMREAD_GRAYSCALE)
# 顺便看看图片的格式,好大的一个列表对象,
# 里面的数组代表了图片上一个个行和列上的像素,格式是[xxx,xxx,xxx]
# xxx = 0~255
print img
# 在名为img的窗口上显示图片,像素为200x200
cv2.imshow('img',img)
cv2.waitKey()
cv2.destroyAllWindows()
    第三步,上正菜,老衲觉得出版社太坑了,给了很多片段,还不给全部源代码,老衲一向自给自足丰衣足食,来看下面老衲整理的一大片代码。
#coding=utf-8
import os
import sys
import cv2
import numpy as np

# 图片的路径
filepath = 'c:\\MyW\\date\\'
# 定义2个数组,X存放每幅图片的数组列表,y存放每幅图片的序号,后面有句print函数
# 可以在IDLE里看哪张图片特征最匹配实时检测到的脸,并给出置信度
X = []
y = []

# 顾名思义,读取特征图片
def read_images(path):
    # 初始化计数器
    c = 0

    # 扫描路径下的路径名,文件名,不明白的可以在下面print一下
    for dirname, dirnames, filenames in os.walk(path):
        # print dirname, dirnames, filename
        # 提取每个文件并保存到X,y数组里,这里老衲做了点改动,应为老衲的特征图片路径没有书上代码那么深
        for filename in filenames:
            try:
                # 组合路径和文件名,得到特征图的绝对路径c:\MyW\date\1.pgm
                filename = os.path.join(path, filename)
                # 把特征图以灰度图读取
                im = cv2.imread(filename, cv2.IMREAD_GRAYSCALE)

                # 重新格式化图片为200x200像素,原书估计打错字了
                if (im is not None):
                   im = cv2.resize(im, (200, 200))

                # 把特征图片数组添加到X数组中,组成一个大的特征数组
                X.append(np.asarray(im, dtype=np.uint8))
                y.append(c)
            # 输入输出错误检查
            except IOError, (errno, strerror):
                print "I/O error({0}): {1}".format(errno, strerror)

            except:
                print "Unexpected error:", sys.exc_info()[0]
                raise
            c = c + 1
    #print X
    #print y
    # 估计到这,这数组的维度大得吓人了
    return [X, y] 

# 顾名思义,人脸检测开始了
def face_rec():
    # 定义一个名字的数组,随便瞎打几个英文字母,等会下面会用到
    names = ['SHG', 'JSY', 'LYF']
    # 加载特征图片
    [x, y] = read_images(filepath)
    # 把y数组保存为int32格式的数组,用asarry()不用开辟新的内存,其实老衲觉得array()函数也可以,现在谁的电脑内存没个几G啊
    y = np.asarray(y, dtype=np.int32)
    # 加载EigenFaceRecognizer算法,这里必须改为EigenFaceRecognizer_create,原书createEigenFaceRecognizer
    # 因为老衲用的是opencv_contrib_python-3.4.0.12-cp27-cp27m-win32.whl
    # 如何安装contrib请各位施主自行百度,后面会讲一个老衲安装时碰到的小故事
    model = cv2.face.EigenFaceRecognizer_create()
    # 训练数据集,貌似机器学习,好高深,不深究
    model.train(np.asarray(X), np.asarray(y))

    # 和第一步里generate()里的用法一样,懒得解释了
    face_cascade = cv2.CascadeClassifier('C:\MyW\cascades\haarcascade_frontalface_default.xml')
    camera = cv2.VideoCapture(1)
    
    while (True):
        read, img = camera.read()
        faces = face_cascade.detectMultiScale(img, 1.3, 5)
        for (x, y, w, h) in faces:
            img = cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
            gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
            roi = gray[x: x+w, y: y+h]
            try:
                # 选出感兴趣的区域,使用内插法,还是老规矩自行百度
                roi = cv2.resize(roi, (200, 200), interpolation=cv2.INTER_LINEAR)
                # 预测实时图片,这里老衲也没看明白,下次有时间去看看EigenFaceRecognizer的方法
                params = model.predict(roi)
                # 把匹配的特征和置信度打印在IDLE内
                print "Label: %s, Confidence: %.2f" % (params[0], params[1])
                # 把匹配的名字显示在方框左上角,有时候会瞎显示,以后研究,还有就是现在无法显示中文字符,也以后吧 :P
                cv2.putText(img, names[params[0]], (x, y - 20), \
                            cv2.FONT_HERSHEY_SIMPLEX, 1, 255, 2)
            except:
                continue
        cv2.imshow("camera", img)
        if cv2.waitKey(1000 / 12) & 0xff == ord("q"):
            break
    cv2.destroyAllWindows()

if __name__ == "__main__":
    face_rec()
    第四步,按F5运行,当当当当,老衲被照妖镜照出来啦,悟空,师傅不是妖精。

参考:1.《OpenCV3计算机视觉Python语言实现》作者:乔.米尼奇诺 约瑟夫.豪斯
         2. 《人脸识别经典算法实现(一)》  作者:freedom098   点击打开链接



评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值