机器视觉
文章平均质量分 87
机器视觉方面的人工智能算法python程序
简简单单做算法
从事人工智能,机器学习,机器视觉,图像处理,信号通信等工作,熟悉MATLAB/verilog/python/opencv/tensorflow/caffe/C/C++等编程语言
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于mediapipe深度学习的虚拟画板系统python源码
摘要:本文介绍了一种基于计算机视觉和深度学习的虚拟画板系统。该系统通过摄像头捕获用户手部动作,利用MediaPipe框架实现手部关键点检测与手势识别,将手部运动转化为虚拟画笔操作。系统流程包括图像采集、手部关键点检测、手势解析、坐标映射和绘图执行。核心算法采用轻量级CNN网络进行21个手部关键点检测,通过分析关键点位置关系定义手势语义(如单指抬起为画笔模式)。系统支持自定义画笔/橡皮宽度,并提供了完整的Python实现代码和运行环境配置说明。原创 2025-06-01 01:57:27 · 1007 阅读 · 0 评论 -
基于mediapipe深度学习的眨眼检测和计数系统python源码
MediaPipe是一个跨平台的机器学习框架,用于处理和分析视频流中的图像数据。它提供了一系列的预训练模型和工具,能够检测和跟踪人体的各种特征,包括面部特征点。眨眼检测原理:眼睛的状态变化(睁开或闭合)会导致眼睛周围的面部特征点的位置和几何关系发生变化。通过 MediaPipe 检测出眼睛区域的关键特征点,分析这些特征点的坐标信息及其动态变化,来判断眼睛是否处于眨眼状态。例如,计算眼睛纵横比(Eye Aspect Ratio,EAR),当 EAR低于某个阈值且持续一定时间,就认为发生了一次眨眼。原创 2025-05-07 00:27:35 · 1074 阅读 · 0 评论 -
基于mediapipe深度学习的人脸面部轮廓,眼睛以及嘴唇实时检测系统python源码
MediaPipe作为一个强大的跨平台机器学习框架,为实现高效准确的人脸面部轮廓、眼睛以及嘴唇实时检测提供了有效的解决方案。它结合了先进的深度学习算法和优化的计算流程,能够在多种设备上实时运行,满足不同场景下的应用需求。深入理解其原理有助于更好地应用该技术,并在此基础上进行拓展和创新。MediaPipe是Google开发的一个基于图形的跨平台框架,用于构建多模态(如视频、音频)应用的机器学习管道。原创 2025-04-15 02:20:48 · 714 阅读 · 0 评论 -
基于mediapipe深度学习和限定半径最近邻分类树算法的人体摔倒检测系统python源码
随着人口老龄化的加剧,老年人摔倒问题日益受到关注。及时检测到人体摔倒并发出警报,对于减少摔倒带来的伤害具有重要意义。基于 Mediapipe 深度学习和限定半径最近邻分类树算法的人体摔倒检测系统,结合了计算机视觉和机器学习的技术,能够有效地对人体摔倒行为进行检测。本系统利用 Mediapipe 进行人体姿态关键点的提取,然后使用限定半径最近邻分类树算法对提取的特征进行分类,判断人体是否摔倒。原创 2025-04-01 04:08:23 · 831 阅读 · 0 评论 -
基于mediapipe深度学习的运动人体姿态提取系统python源码
Mediapipe使用预训练的深度学习模型来进行人体姿态提取,常见的模型结构如OpenPose模型。该模型通过对大量人体姿态图像数据的学习,构建了一个能够准确预测人体关节位置的模型。模型的目标是检测人体的多个关键点(如头部、肩部、肘部、腕部、髋部、膝部、踝部等)的位置。对于每个关键点,模型输出一个置信度图(confidence map),表示该关键点在图像中每个位置出现的概率。在检测到各个关键点后,需要确定哪些关键点属于同一肢体,从而构建完整的人体姿态骨架。原创 2025-03-18 05:48:33 · 1346 阅读 · 0 评论 -
基于mediapipe深度学习的手势数字识别系统python源码
手势识别作为人机交互的重要方式,在虚拟现实、智能监控、智能家居等领域有着广泛的应用。通过识别用户的手势,可以实现更加自然、便捷的交互体验。Mediapipe是Google开发的一款跨平台的开源框架,它提供了高效、易用的工具,能够快速构建多媒体处理管道。原创 2025-02-14 22:33:53 · 1628 阅读 · 0 评论
分享