opencv项目10---利用Mediapipe库实时检测人脸468个特征点

本文介绍如何使用谷歌的MediaPipe库提取人脸中的468个特征点,并提供了详细的代码示例。MediaPipe库不仅支持高精度的人脸特征点检测,还能实现人脸识别、手势识别等功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我们利用dlib人脸检测库,以及一些主流的人脸检测库大多数都是68个特征点,当我们需要更多的特征点是该怎么办?这个谷歌的mediapipe库里面可以为我们提供多达468个特征点,而且这些特征点是(x,y,z)的数据类型,意味着是3维的数据,实现了类似于深度传感器的功能。他可以提供人脸识别,人脸检测,手势识别,姿态检测等一系列功能。

mediapipe

今我们就来实现一下如何提取人脸中的468个人特征点:

先是导入这个库:

import mediapipe as mp

如果没有这个库的可通过 终端 pip install mediapipe

如果是aconda配置的环境, 要先进入自己的环境 conda activate [你的环境]

再pip install mediapipe

j接下俩就是导入facemesh的莫模型以及配置参数,代码中的注释我都有添加,大家可以看看。

如果有自己不懂的函数直接点进去,然后通过函数的英文注释,大家就会明白大概每个函数的参数如何设置。

import cv2
import mediapipe as mp
import time
cv2
cap = cv2.VideoCapture(r'C:\Users\10334\Desktop\csdn\20220919214835.mp4')
pTime = 0
#调用人脸绘画模型工具
mpDraw = mp.solutions.drawing_utils
#设置模型的参数
mpFaceMesh = mp.solutions.face_mesh
#将人脸检测数最大设置为2
faceMesh = mpFaceMesh.FaceMesh(max_num_faces=2)
#这时设置人脸绘画的参数
drawSpec = mpDraw.DrawingSpec((0,244,56),thickness=1, circle_radius=1)

while True:
    success, img = cap.read()
    #将bgr图像转换为rgb图像
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    #将图像传至到面网模型中
    results = faceMesh.process(imgRGB)
    #具有“multi_face_landmarks”字段的命名元组对象,该字段包含每一张检测到的人脸上的人脸标记。
    if results.multi_face_landmarks:
        #将获取的list进行遍历
        for faceLms in results.multi_face_landmarks:
            """image:一个表示为numpy ndarray的三通道BGR图像。
                landmark_list:要注释的规范化地标列表原消息图像。
                连接:指定如何连接的地标索引元组的列表在图中连接。
                landmark_drawing_spec: DrawingSpec对象或来自的映射将地标传递到指定地标绘图的DrawingSpecs,如颜色、线厚和圆半径的设置。如果此参数显式设置为None,则不会绘制任何地标。
                connection_drawing_spec:一个DrawingSpec对象或来自的映射手工连接到指定的DrawingSpecs连接的绘图设置,如颜色和线厚。如果此参数显式设置为None,则没有地标连接被吸引。"""
            mpDraw.draw_landmarks(img, faceLms,mpFaceMesh.FACEMESH_CONTOURS,drawSpec,drawSpec)
            for id,lm in enumerate(faceLms.landmark):
                ih, iw, ic = img.shape
                #将归一化的数据变为图像大小
                x,y = int(lm.x*iw), int(lm.y*ih)
                print(id,x,y)

    cTime = time.time()
    fps = 1 / (cTime - pTime)
    pTime = cTime
    cv2.putText(img, f'FPS: {int(fps)}', (20, 30), cv2.FONT_HERSHEY_PLAIN,
                2, (0, 0, 255), 3)
    cv2.imshow("Image", img)
    cv2.waitKey(1)

实现的效果如下:

video

仅供学习参考,如有不足,敬请指正!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值