Mediapipe简介

 

1. MediaPipe简介

Mediapipe是google的一个开源项目,可以提供开源的、跨平台的常用机器学习(machine learning)方案。Mediapipe实际上是一个集成的机器学习视觉算法的工具库,包含了人脸检测、人脸关键点、手势识别、头像分割和姿态识别等各种模型。

2cdf676c0b6049c1a2c1f7e3914acb9e.png

 

2. MediaPipe优

1)支持各种平台和语言,包括IOS,Android,C++,Python,JAVAScript,Coral等;
2)速度快,各种模型基本上可以做到实时运行。

3. 依赖库

MediaPipe依赖OpenCV来处理视频,FFMPEG来处理音频数据。它还有其他依赖项,如OpenGL/MetalTensorflowEigen等。

4.应用产品

Netcom的感知系统、谷歌镜头的目标检测、增强现实广告、谷歌图片、谷歌Home、Gmail、云视觉API等。

5. MediaPipe中的计算器类型

预处理计算单元是图像和媒体处理计算单元族。上图中的ImageTransform和imagetotensor就属于这一类;

推理计算单元允许与Tensorflow和Tensorflow Lite进行ML推理的本地集成;

后处理计算单元执行ML后处理任务,如检测、分割和分类。TensorToLandmark是一个后处理计算单元;

计算单元工具是执行任务的一类计算单元。

6. MediaPipe中Solutions

Solutions是基于特定的预训练TensorFlow或TFLite模型的开源预构建示例。它一共提供了16个Solutions:人脸检测Face Mesh(面网)虹膜姿态人体人物分割头发分割目标检测Box Tracking(方格追踪)Instant Motion Tracking实时运动跟踪3D目标检测特征匹配AutoFlip(视频裁剪)MediaSequence(媒体序列)YouTube-8M(视频标签比赛)。2cb086fee794408c884740132a70f181.png

 

7.MediaPipe的框架

框架是用c++、Java和Obj-C编写的,包含以下api

  • Calculator API (C++).
  • Graph construction API (Protobuf).
  • Graph Execution API (C++, Java, Obj-C).

Graphs

MediaPipe感知管道称为Graph。让我们以第一个solution为例,汉兹。我们输入一串图像作为输入,然后在图像上呈现手的landmarks。

5cb06db3083f40c9b0d93a478445e1e8.png

 

下面的流程图代表MP(简称MediaPipe)hand solution graph。

0bb1b9316ebd4eed83ac768b58092f1f.png

 

 

8.MediaPipe的应用

Mediapipe手势识别

  1. OpenCV调用摄像头;
  2. 调用mediapipe中的hands模块;
  3. demo示例。

手势识别

基于mediapipe我们已经能够获取手指关键点的坐标位置了,进一步只需要判断每根手指的开合状态即可得到手势。先贴以下关键点分布图:

Mediapipe姿态识别

1.OpenCV调用摄像头(同手势识别);
2.调用Mediapipe中的pose模块;

3.demo示例。

姿态估计模型主要有三类:

1.运动学模型:它是一种基于骨骼的模型,代表人体。

2.平面模型:平面模型是一种基于轮廓的模型,它使用人体周围的轮廓来表示人体形状。

3. 体积模型:体积模型创建人体的 3d 网格,表示人体的形状和外观watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAYmFzaGVuZGl4aWU1,size_20,color_FFFFFF,t_70,g_se,x_16

 

 

 

 

 

 

 

基于深度学习mediapipe的人脸打码pyqt5界面人脸模糊源码

基于深度学习mediapipe的人脸打码pyqt5界面人脸模糊源码 效果演示:https://www.bilibili.com/video/BV1uw411o72E/?spm_id_from=333.999.0.0 文章介绍:https://blog.youkuaiyun.com/babyai996/article/details/130385775

最新发布 基于mediapipe实现手势数字识别机器学习项目python源码+数据集+项目操作说明.zip

<项目介绍> 基于mediapipe实现手势数字识别机器学习项目python源码+数据集+项目操作说明.zip 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到94.5分,放心下载使用! 该...

毕设新项目基于Mediapipe的手势识别前端应用+使用说明+exe可执行文件.zip

【项目资源介绍】 基于AutoHotkey制作的摄像头手势识别软件。能让你的电脑摄像头在识别手势后,执行自定义的电脑操作命令。同时也集成了语音识别功能,可调用Windows自带API实现简单的语音助手功能。 手势识别调用了...

(判断是否踢被子和苏醒)+带测试视频+代码注释.zip

mediapipe两个类库...

跌倒识别系统源码+项目使用说明(毕设项目).zip

对提取...

基此继续访问

继续访问

 

...

 

### MediaPipe全面介绍 #### 1. **MediaPipe简介** MediaPipe 是由 Google 开发的一个开源框架,专注于构建多模态应用的机器学习管道。该框架支持多种数据源,包括但不限于视频、音频和传感器数据,并能够处理时间序列数据[^2]。 #### 2. **功能特点** - **跨平台支持**: MediaPipe 支持多个操作系统和硬件架构,例如 Raspberry Pi OS (aarch64)、Ubuntu (aarch64)、Debian (aarch64) 和 NVIDIA Jetson Nano 等设备上的部署[^1]。 - **模块化设计**: 基于图结构的设计理念,允许开发者将不同的感知模型抽象为独立的节点(模块),并通过定义好的接口连接成完整的流水线[^2]。 - **实时性能优化**: 特别适合需要高性能计算的应用场景,比如手势识别、面部表情分析等任务,在移动设备端也有良好的表现[^3]。 #### 3. **安装指南** ##### (1)Python环境准备 确保本地已安装 Python 3.7 或更高版本。如果尚未完成此操作,则可以从官方站点获取最新发行版进行设置:https://www.python.org/getit/。 ##### (2)依赖库配置 在开始之前还需要引入一些必要的第三方包作为基础支撑工具集之一便是 OpenCV ,它提供了丰富的图像处理函数集合 。可以通过如下命令轻松实现自动化装配流程 : ```bash pip install opencv-contrib-python ``` ##### (3)核心组件加载 接着就是正式引入 mediapipe 库本身了 , 这一步骤同样非常简便快捷只需运行下面这条语句即可完成全部准备工作: ```bash pip install mediapipe ``` #### 4. **基本使用示例** 以下展示了一个简单的例子说明如何利用 Mediapipe 实现手部关键点检测: ```python import cv2 import mediapipe as mp mp_hands = mp.solutions.hands.Hands(static_image_mode=False,max_num_hands=2,min_detection_confidence=0.5) cap=cv2.VideoCapture(0) while True: ret,img=cap.read() imgRGB=cv2.cvtColor(img,cv2.COLOR_BGR2RGB) results=mp_hands.process(imgRGB) if results.multi_hand_landmarks is not None: for handLms in results.multi_hand_landmarks: for id,lm in enumerate(handLms.landmark): h,w,c=img.shape cx,cy=int(lm.x*w),int(lm.y*h) print(id,(cx,cy)) cv2.imshow('Hand',img) key=cv2.waitKey(1)&0xFF if key==ord('q'): break cv2.destroyAllWindows() ``` 这段脚本开启摄像头捕获画面后调用手势追踪算法标记出手掌位置及其特征点坐标值输出至控制台窗口直至按下键盘按键 'Q' 结束程序执行为止。 --- ###
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值