mediapipe 眨眼检测、头部三轴姿态检测（改进版）

原创

已于 2022-12-07 19:10:40 修改 · 4.3k 阅读

42 ·

CC 4.0 BY-SA版权

文章标签：

#python #opencv #开发语言

于 2022-12-05 09:59:15 首次发布

本文介绍使用MediaPipe实现眨眼检测的技术细节，并分享了一个利用平均参数提高检测精度的方法。此外，还介绍了如何进行头部三轴姿态检测。

其实视觉检测的项目我也搞了一段时间了，只不过自我感觉不精，基本就是调库侠加拼接侠，会把各种例程拼来拼去的。
今天研究的是眨眼检测，开始用的是比较常见的opencv dlib的库，不过发现逼格不够高，有三个缺点：一是模型要64m，二是点数只有64，三是对侧脸的检测效果不好。特别是第三点很影响实际效果，所以为啥不用高大上的mediapipe呢？
很快找到了一个外国大佬的项目，在此
GITHUB-mediapipe眨眼检测
拿下来就直接可以用，很好，meidapipe的人脸mask检测有400多个点，这个库里给出了人脸眉毛合嘴巴的具体点数，省了很多事儿了，不过实际跑下来效果过不太好，原因很简单，**可能我眼睛太小了。。。**而且头部高低不同眼睛的参数也不同，为了适合更多人合更多姿态，我加了个平均参数，就是取前5次的平均值再来跟本次比较，这样一来就准确多啦！
不废话，上源码：

from numpy import *
import cv2 as cv
import mediapipe as mp
import time
import utils, math
import numpy as np
# variables 
frame_counter =0
CEF_COUNTER =0
TOTAL_BLINKS =0
# constants
THRESHOLD=0.6    #关键参数1，闭眼与睁眼的阈值调整，越大越不容易检测
CLOSED_EYES_FRAME =1    #关键参数2，闭眼的帧数，越大判定的时间越久
FONTS =cv.FONT_HERSHEY_COMPLEX

# face bounder indices 
FACE_OVAL=[ 10, 338, 297, 332, 284, 251, 389, 356, 454, 323, 361, 288, 397, 365, 379, 378, 400, 377, 152, 148, 176, 149, 150, 136, 172, 58, 132, 93, 234, 127, 162, 21, 54, 103,67, 109]

# lips indices for Landmarks
LIPS=[ 61, 146, 91, 181, 84, 17, 314, 405, 321, 375,291, 308, 324, 318, 402, 317, 14, 87, 178, 88, 95,185, 40, 39, 37,0 ,267 ,269 ,270 ,409, 415, 310, 311, 312, 13, 82, 81, 42, 183, 78 ]
LOWER_LIPS =[61, 146, 91, 181, 84, 17, 314, 405, 321, 375, 291, 308, 324, 318, 402, 317, 14, 87, 178, 88, 95]
UPPER_LIPS=[ 185, 40, 39, 37,0 ,267 ,269 ,270 ,409, 415, 310, 311, 312, 13, 82, 81, 42, 183, 78] 
# Left eyes indices 
LEFT_EYE =[ 362, 382, 381, 380, 374, 373, 390, 249, 263, 466, 388, 387, 386, 385,384, 398 ]
LEFT_EYEBROW =[ 336, 296

最低0.47元/天解锁文章

7 条评论

BeichuanNice 2024.03.19
运行起来，啥效果也没发现，也不发个测试图。。
- 三十岁开始学编程的大叔回复BeichuanNice 2024.03.21
  不发图一是懒，二是觉得简单到没必要发[face]emoji:007.png[/face]

m0_59618088 2023.11.11
success, rotation_vec, transition_vec = cv2.solvePnP( cv2.error: OpenCV(4.7.0) D:\a\opencv-python\opencv-python\opencv\modules\calib3d\src\solvepnp.cpp:840: error: (-215:Assertion failed) ( (npoints >= 4) || (npoints == 3 && flags == SOLVEPNP_ITERATIVE && useExtrinsicGuess) || (npoints >= 3 && flags == SOLVEPNP_SQPNP) ) && npoints == std::max(ipoints.checkVector(2, CV_32F), ipoints.checkVector(2, CV_64F)) in function 'cv::solvePnPGeneric' 有这个报错是为什么呀

NoNoUnknow 2023.07.28
face_coordination_in_real_world = np.array([ [285, 528, 200], [285, 371, 152], [197, 574, 128], [173, 425, 108], [360, 574, 128], [391, 425, 108] ], dtype=np.float64) 您好，请问这里的数值依据是怎么获得的呢？
- 空耳飞白回复NoNoUnknow 2025.08.12
  https://blog.youkuaiyun.com/weixin_67879842/article/details/146349640 这里可以看
- laowan_good_man回复三十岁开始学编程的大叔 2024.10.22
  测试了有效果，我想给定更多的脸部特征点坐标，我想知道那个给定的坐标值是怎么计算出来的，源码好像也没特别声明，博主研究明白了能分享下么
- 三十岁开始学编程的大叔回复NoNoUnknow 2024.03.21
  源码就是这么来的，没研究过