基于微信小程序的面部动作检测

最新推荐文章于 2025-10-23 15:55:53 发布

原创

最新推荐文章于 2025-10-23 15:55:53 发布 · 1.7k 阅读

24 ·

CC 4.0 BY-SA版权

由数入道-易牧阳

文章标签：

#微信小程序 #小程序

引言

微信小程序的面部动作检测的核心功能包括检测用户的左右转头、眨眼和张嘴动作，并根据检测结果逐步引导用户完成任务。为确保系统的安全性和准确性，特别是防止用户通过图片或视频欺骗系统，本文进一步深入分析并提出了相应的优化和防护措施。

系统架构概述

系统采用前后端分离的架构，前端为微信小程序，负责用户交互和界面展示；后端为基于Python的API服务，负责图像处理、动作识别和任务状态管理。系统通过HTTPS协议进行数据交互，前后端通信采用JSON格式。

系统架构图

前端实现细节

技术框架与组件

微信小程序框架
- 使用WXML、WXSS、JavaScript或TypeScript进行开发。
UI 组件库
- 使用WeUI或第三方UI库快速搭建界面。
数据交互
- 利用wx.request接口与后端API进行通信。
防欺骗措施
- 实时性要求高，结合前端技术实现活体检测提示。

核心功能模块

任务显示模块
- 动态显示当前任务提示（如“请向左转头”）。
实时反馈模块
- 实时显示检测结果（成功/失败）。
进度条与状态提示
- 使用进度条展示任务完成进度。
重新开始选项
- 提供“重新开始”按钮，允许用户重新进行任务检测。
活体检测提示
- 在采集图像时提示用户进行自然动作（如眨眼、张嘴）以确保活体性。

数据采集与传输

数据采集

静态图片采集
- 使用wx.chooseImage捕捉用户当前图像。
视频帧采集
- 使用摄像头实时捕捉视频流，并定时截取帧进行检测。

数据传输流程

捕捉图像/视频帧
- 用户点击“开始检测”后，前端启动摄像头并捕捉图像或视频帧。
编码图像数据
- 使用Base64对图像数据进行编码。
构建JSON请求
- 包含user_id和image_data字段。
发送HTTP POST请求
- 通过wx.request将JSON数据发送至后端API。

示例代码：捕捉静态图片并发送至后端

// pages/capture/capture.js
Page({
   
   
  captureImage: function() {
   
   
    wx.chooseImage({
   
   
      count: 1,
      sourceType: ['camera'],
      success: function(res) {
   
   
        const tempFilePath = res.tempFilePaths[0];
        wx.getFileSystemManager().readFile({
   
   
          filePath: tempFilePath,
          encoding: 'base64',
          success: function(data) {
   
   
            const base64Data = data.data;
            wx.request({
   
   
              url: 'https://your-backend-api.com/api/task/detect',
              method: 'POST',
              header: {
   
   
                'Content-Type': 'application/json'
              },
              data: {
   
   
                user_id: 'unique_user_id',
                image_data: base64Data
              },
              success: function(response) {
   
   
                // 处理后端返回的检测结果
                console.log(response.data);
                // 更新界面提示
              },
              fail: function(error) {
   
   
                console.error('请求失败', error);
                // 提示用户网络错误
              }
            });
          },
          fail: function(error) {
   
   
            console.error('读取文件失败', error);
            // 提示用户读取文件失败
          }
        });
      },
      fail: function(error) {
   
   
        console.error('选择图片失败', error);
        // 提示用户选择图片失败
      }
    });
  }
});

示例代码：实时视频帧采集并发送至后端

// pages/capture/capture.js
Page({
   
   
  data: {
   
   
    cameraContext: null,
    intervalId: null
  },
  onLoad: function() {
   
   
    this.setData({
   
   
      cameraContext: wx.createCameraContext()
    });
  },
  startCapture: function() {
   
   
    const intervalId = setInterval(() => {
   
   
      this.data.cameraContext.takePhoto({
   
   
        quality: 'low',
        success: (res) => {
   
   
          const base64Path = res.tempImagePath;
          wx.getFileSystemManager().readFile({
   
   
            filePath: base64Path,
            encoding: 'base64',
            success: (data) => {
   
   
              wx.request({
   
   
                url: 'https://your-backend-api.com/api/task/detect',
                method: 'POST',
                header: {
   
   
                  'Content-Type': 'application/json'
                },
                data: {
   
   
                  user_id: 'unique_user_id',
                  image_data: data.data
                },
                success: (response) => {
   
   
                  // 处理后端返回的检测结果
                  console.log(response.data);
                  // 更新界面提示
                },
                fail: (error) => {
   
   
                  console.error('请求失败', error);
                  // 提示用户网络错误
                }
              });
            },
            fail: (error) => {
   
   
              console.error('读取文件失败', error);
              // 提示用户读取文件失败
            }
          });
        },
        fail: (error) => {
   
   
          console.error('拍照失败', error);
          // 提示用户拍照失败
        }
      });
    }, 1000); // 每秒截取一帧
    this.setData({
   
    intervalId });
  },
  stopCapture: function() {
   
   
    clearInterval(this.data.intervalId);
  }
});

用户界面设计

任务提示
- 显示当前任务描述，如“请向左转头”、“请眨眼”、“请张嘴”。
实时反馈
- 使用颜色变化或图标显示检测结果（成功/失败）。
进度条
- 展示任务完成的进度，例如三步任务进度。
重新开始按钮
- 提供用户在检测失败时重新开始任务的选项。
活体检测提示
- 在活体检测过程中，提示用户进行自然动作（如“请自然眨眼”），防止用户使用照片或视频欺骗系统。

后端实现细节

技术选型

编程语言：Python
Web框架：FastAPI（高性能，支持异步处理）
图像处理库：OpenCV
人脸检测与关键点提取：MediaPipe
状态管理：Redis（高效管理用户任务状态）
容器化：Docker（可选，用于部署）
活体检测模型：基于动作识别的简单活体检测，结合动作提示确保用户实时互动

核心功能模块

API 接口设计
- POST /api/task/detect：接收用户图像数据，进行动作检测，返回检测结果。
- GET /api/task/status：获取当前任务状态。
- POST /api/task/reset：重置任务状态。
图像预处理
- 解码Base64图像数据，转换为OpenCV图像数组。
人脸检测与关键点提取
- 使用MediaPipe Face Mesh提取面部关键点。
动作识别
- 分别检测左右转头、眨眼、张嘴。
- 增加活体检测逻辑，确保用户进行实时互动。
状态管理
- 使用Redis记录每个用户的当前任务进度和状态。
防欺骗措施
- 结合活体检测，确保用户进行实时的动作交互，防止使用图片或视频欺骗系统。

数据处理流程

接收图像数据
- 接收前端通过POST /api/task/detect发送的Base64编码图像数据和user_id。
解码与预处理
- 将Base64编码的图像数据解码为OpenCV图像数组。
人脸检测与关键点提取
- 使用MediaPipe提取面部关键点，获取468个关键点。
动作识别与活体检测
- 根据当前任务步骤，识别相应的动作。
- 增加活体检测逻辑，通过多次动作交互确保用户为真人。
结果封装与返回
- 根据动作识别结果和任务进度，构建JSON响应返回前端。
状态更新
- 更新用户的任务进度和状态，存储至Redis。

示例代码

# main.py
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
import base64
import cv2
import numpy as np
import mediapipe as mp
import math
import redis
import json

app = FastAPI()

# 初始化 MediaPipe Face Mesh
mp_face_mesh = mp.solutions.face_mesh
face_mesh = mp_face_mesh.FaceMesh(
    static_image_mode=False,
    max_num_faces=1,
    refine_landmarks=True,
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5
)

# 初始化 Redis 客户端
redis_client = redis.Redis(host='localhost', port=6379, db=0)

# 定义请求数据模型
class DetectRequest(BaseModel):
    user_id: str
    image_data: str

# 定义响应数据模型
class DetectResponse(BaseModel):
    success: bool
    message: str
    next_task: str = None
    current_step: int = None

@app.post("/api/task/detect", response_model=DetectResponse)
async def detect_task(request: DetectRequest):
    user_id = request.user_id
    image_base64 = request.image_data

    if not user_id or not image_base64:
        raise HTTPException(status_code=400, detail="缺少 user_id 或 image_data")

    # 解码 Base64 图像数据
    try:
        image = decode_image(image_base64)
    except Exception as e:
        raise HTTPException(status_code=400, detail="图像解码失败")

    # 获取人脸关键点
    landmarks = get_face_landmarks(image)
    if not landmarks:
        return DetectResponse(success=False, message="未检测到人脸")

    # 获取或初始化用户状态
    state = get_user_state(user_id)

    # 识别动作
    action_results = recognize_actions(landmarks, state)

    # 评估当前步骤
    success, next_task, updated_step = evaluate_current_step(state, action_results)

    # 更新状态
    if success:
        if updated_step > 3:
            # 所有任务完成，重置状态
            reset_user_state(user_id)
            return DetectResponse(success=True, message="成功完成所有任务", next_task="完成", current_step=updated_step)
        else:
            update_user_state(user_id, 'current_step', updated_step)
            return DetectResponse(success=True, message="检测成功，进入下一步", next_task=next_task, current_step=updated_step)
    else:
        reset_user_state(user_id)
        return DetectResponse(success=False, message="检测失败，请重新开始", current_step=1)

def decode_image(image_base64: str) -> np.ndarray:
    img_data = base64.b64decode(image_base64)
    np_arr = np.frombuffer(img_data, np.uint8)
    img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
    if img is None:
        raise ValueError("无法解码图像")
    return img

def get_face_landmarks(image: np.ndarray):
    rgb_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    results = face_mesh.process(rgb_image)
    if results.multi_face_landmarks:
        return results.multi_face_landmarks[0]
    else:
        return None

def get_user_state(user_id: str) -> dict:
    state_json = redis_client.get(f"user:{
     
     user_id}:state")
    if state_json:
        return json.loads(state_json)
    else:
        # 初始化状态
        initial_state = {
   
   
            'current_step': 1,
            'blink_counter': 0,
            'total_blinks': 0,
            'mouth_opened': False,
            'head_direction_history': [],  # 用于活体检测
            'blink_history': [],           # 用于活体检测
            'mouth_history': []            # 用于活体检测
        }
        redis_client.set(f"user:{
     
     user_id}:state", json.dumps(initial_state))
        return initial_state

def update_user_state(user_id: str, key: str, value):
    state = get_user_state(user_id)
    state[key] = value
    redis_client.set(f"user:{
     
     user_id}:state", json.dumps(state))

def reset_user_state(user_id: str):
    initial_state = {
   
   
        'current_step': 1,
        'blink_counter': 0,
        'total_blinks': 0,
        'mouth_opened': False,
        'head_direction_history': [],
        'blink_history': [],
        'mouth_history': []
    }
    redis_client.set(f"user:{
     
     user_id}:state", json.dumps(initial_state))

def recognize_actions(landmarks, state: dict) -> dict:
    action_results = {
   
   }

    # 检测左右转头
    head_direction = detect_head_turn(landmarks)
    action_results['head_turn'] = head_direction

    # 检测眨眼
    state['blink_counter'], state['total_blinks'] = detect_blink(
        landmarks, state['blink_counter'], state['total_blinks']
    )
    action_results['blink_count'] = state['total_blinks']

    # 检测张嘴
    state['mouth_opened'] = detect_mouth_open(landmarks, state['mouth_opened'])
    action_results['mouth_opened'] = state['mouth_opened']

    # 记录历史数据用于活体检测
    state['head_direction_history'].append(head_direction)
    state['blink_history'].append(state['total_b