Python 实现人脸追踪_python图像追踪

最新推荐文章于 2025-04-01 20:41:16 发布

努力马斯克

最新推荐文章于 2025-04-01 20:41:16 发布

阅读量723

点赞数 10

分类专栏：程序员文章标签： python 学习面试

本文链接：https://blog.youkuaiyun.com/m0_60452293/article/details/138937810

版权

程序员专栏收录该内容

197 篇文章

订阅专栏

文末有福利领取哦~

👉一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

👉二、Python必备开发工具

👉三、Python视频合集

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

👉 四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（文末领读者福利）

👉五、Python练习题

检查学习结果。

👉六、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

👉因篇幅有限，仅展示部分资料，这份完整版的Python全套学习资料已经上传

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

修改图片大小

re_im = cv2.resize(im, (width//2, height//2))

将图片写入文件

cv2.imwrite(‘xscn_copy.png’, re_im)

显示图片

cv2.imshow(‘im’, re_im)
cv2.waitKey(0)
cv2.destroyAllWindows()
复制代码


在我们导入的时候是导入`cv2`，读取图片的函数为`imread`，传入图片的路径，调用该函数后会返回一个`ndarray`对象。在返回的对象中，`shape`属性包含了宽高和通道数的信息。


在 OpenCV 中大多数操作都是直接使用模块中的函数操作`ndarray`对象，在显示图片时我们通常有三个步骤。首先是使用`imshow`显示图片，该函数传入窗口名和图片的`ndarray`对象。调用`imshow`函数图像只会显示一瞬间，我们需要调用`waitKey`让图片显示有一个时长，传入的参数为毫秒数，当传入 0 时表示无限等待。最后就是回收内存，因为 OpenCV 底层是 C++，所以我们需要回收窗口内存。


##### 2.2 绘制形状


为了看起来更直观，我们需要将人脸绘制出来，我们来看看 opencv 中如何在图片上绘制形状。

import cv2

读取图片

im = cv2.imread(‘xscn_copy.png’)

绘制图形

cv2.rectangle(im, (0, 0), (100, 100), (0, 255, 0), 2)

显示图片

cv2.imshow(‘im’, im)
cv2.waitKey(0)
cv2.destroyAllWindows()
复制代码


因为不是专门学习 OpenCV，所以这里只讲绘制矩形的函数`rectangle`。该函数通常传入五个参数，第一个为图片的 ndarray 对象，第二个为矩形左上角的坐标，第三个参数为右下角的坐标，第四个为颜色的元组，第五个则是线条的宽度。


##### 2.3 读取视频


OpenCV 中提供了读取视频的类`VideoCapture`，我们可以使用该类读取视频，也可以使用该类读取设备的摄像头：

import cv2

读取指定视频

cap = cv2.VideoCapture(‘video.mp4’)

读取帧，ret 表示是否有下一帧，frame 为当前帧的 ndarray 对象

ret, frame = cap.read()
while ret:
# 将当前帧缩小后显示
cv2.imshow(‘im’, cv2.resize(frame, (frame.shape[1]//2, frame.shape[0]//2)))
# 等待 10 毫秒
cv2.waitKey(10)
# 读取下一帧
ret, frame = cap.read()

回收内存

cv2.destroyAllWindows()
复制代码


在我们使用`VideoCapture`时，如果传入数字则表示读取第 n 个摄像头，通常设备只有 2 个摄像头，所以选取参数在 0 和 1，大家可以自己测试一下。


#### 3. 人脸检测


在检测人脸之前我们需要获取人脸的特征文件，这个当然不需要我们自己创建，我们可以在 [OpenCV 官网]( )下载相应版本，界面如下：


![在这里插入图片描述](https://img-blog.csdnimg.cn/img_convert/010802c77da16bb5f401120102bfde34.webp?x-oss-process=image/format,png)


下载后安装，然后在文件下 opencv\sources\data\haarcascades 找到对应的特征文件，通常我们使用 haarcascade\_frontalface\_default.xml 作为特征文件进行检测。如果有 GPU 加速可以使用 opencv\sources\data\haarcascades\_cuda 下的特征文件。


下面我们就看看如何实现人脸检测：

import cv2

加载特征文件

face_detector = cv2.CascadeClassifier(‘haarcascade_frontalface_default.xml’)

读取人脸图片

face_im = cv2.imread(‘xscn.png’)

灰度转换

grey = cv2.cvtColor(face_im, cv2.COLOR_BGR2GRAY)

检测人脸

faces = face_detector.detectMultiScale(grey)

遍历人脸

for x, y, w, h in faces:
# 在人脸区域绘制矩形
cv2.rectangle(face_im, (x, y), (x+w, y+h), (0, 255, 0), 5)
cv2.imshow(‘face’, cv2.resize(face_im, (face_im.shape[1]//2, face_im.shape[0]//2)))
cv2.waitKey(0)

cv2.destroyAllWindows()
复制代码


我们将检测人脸的步骤大致分为如下：


1. 加载特征文件
2. 读取包含的人脸图片
3. 灰度转换
4. 检测人脸图片
5. 遍历人脸


加载特征文件是通过 CascadeClassifier 类实现的。在读取人脸图像后我们进行灰度转换，这样是为了消除一些干扰信息。然后调用“检测者” face\_detector 的 detectMultiScale 方法检测人脸，返回一个列表，列表中每个元素包含四个信息，人脸矩形左上角的 x、y 以及人脸的宽高。检测结果如下：


![在这里插入图片描述](https://img-blog.csdnimg.cn/img_convert/be67a55a1da6c55119b28d79cc33f1df.webp?x-oss-process=image/format,png)


可以看到图中检测到了两个人脸，但是有一个是错误的。在准确率方面，OpenCV 的准确率也还算可以。


#### 4. 人脸追踪


人脸追踪是建立在人脸检测之上的，在读取视频的时候对每一帧图像进行人脸检测就能实现人脸追踪的效果了。下面我们来看看具体的代码：

import cv2

读取视频

cap = cv2.VideoCapture(‘video.mp4’)

加载特征文件

face_detector = cv2.CascadeClassifier(‘haarcascade_frontalface_default.xml’)

读取帧

ret, frame = cap.read()

循环读取

while ret:
# 灰度转换
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 检测人脸
faces = face_detector.detectMultiScale(grey)

# 遍历人脸
for x, y, w, h in faces:
	# 绘制矩形
    cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 5)
    cv2.imshow('video.mp4', cv2.resize(frame, (frame.shape[1]//2, frame.shape[0]//2)))
    cv2.waitKey(10)
    break	# 只绘制一个人脸就到下一帧
# 读取下一帧
ret, frame = cap.read()

销毁窗口

cv2.destroyAllWindows()
复制代码


效果如下图：


![在这里插入图片描述](https://img-blog.csdnimg.cn/img_convert/365b06b4361768b540d2925cc2494b26.webp?x-oss-process=image/format,png)


上面的代码就是读取视频和人脸检测的结合没有额外的内容。在遍历人脸的时候我添加了一个 break，这样是为了方便，这样的话只绘制一个人脸。当然我们可以将检测结果视频保存到本地，这需要用到我们的 VideoWriter 类了：

import cv2
cap = cv2.VideoCapture(‘video.mp4’)

获取原视频的帧率

fps = cap.get(cv2.CAP_PROP_FPS)

获取画面大小

width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
size = (width, height)

写入视频

fourcc = cv2.VideoWriter_fourcc(*‘mp4v’)
writer = cv2.VideoWriter(‘result.mp4’, fourcc, fps, size)

加载特征文件

face_detector = cv2.CascadeClassifier(‘haarcascade_frontalface_default.xml’)

ret, frame = cap.read()
while ret:
# 灰度转换
grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 检测人脸
faces = face_detector.detectMultiScale(grey)
for x, y, w, h in faces:
cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 5)
cv2.imshow(‘video.mp4’, cv2.resize(frame, (frame.shape[1]//2, frame.shape[0]//2)))
cv2.waitKey(10)
break
# 将当前帧写入视频
writer.write(frame)
ret, frame = cap.read()

释放

writer.release()
cv2.destroyAllWindows()
复制代码


执行后我们可以在项目下看到 result.mp4 文件，就是我们的结果视频。我们先是用 VideoWriter\_fourcc 类来设置视频的模式信息，然后创建 VideoWriter 对象进行视频的写入，我们将处理好的图像帧写入视频，最后调用 release 释放。如果我们不释放的话视频会出问题。


### 关于Python技术储备


学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！



**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里获取](https://bbs.youkuaiyun.com/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**