《计算机视觉》
文章平均质量分 87
主要围绕计算机视觉层面展开交流分享
道1993
发上等愿,结中等缘,享下等福;择高处立,寻平处住,向宽处行
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python实现电脑手势识别截图
本文介绍了一个基于手势识别的全屏截图系统。该系统通过USB摄像头实时捕捉手部动作,利用MediaPipe库检测21个手掌关键点,计算指尖到手腕的距离变化来判断手的张合程度(0-1范围)。当检测到"从握拳到完全张开"的手势突变时,自动触发全屏截图并保存到指定目录。系统创新性地解决了OpenCV中文显示问题,通过matplotlib实现中文界面提示。程序采用模块化设计,包含手势识别、状态检测、截图触发等核心功能,支持跨平台使用。该项目为演示、教学等场景提供了非接触式截图方案,并具备扩展多种手原创 2025-11-14 09:42:54 · 1407 阅读 · 0 评论 -
PyTorch 与 TensorFlow 的深度对比分析
PyTorch与TensorFlow深度对比分析:PyTorch由Facebook开发,采用动态计算图,适合研究和原型开发,代码更Pythonic;TensorFlow由Google开发,早期采用静态计算图,部署能力强,适合工业应用。PyTorch调试更直观,学术研究更受欢迎;TensorFlow生态更成熟,企业应用更广泛。两者功能逐渐趋同,选择时需考虑团队能力、项目需求和部署环境。代码示例展示了二者实现相同神经网络时的语法差异,PyTorch更灵活,TensorFlow更集成。原创 2025-09-18 11:56:10 · 1147 阅读 · 4 评论 -
USB 摄像头实现高精度弹孔识别环数模型
摘要:本文提出一种基于USB摄像头的高精度弹孔识别方案,通过硬件选型(1080P分辨率摄像头+红外补光)、图像标定(亚像素级坐标映射)和深度学习算法(YOLOv8n粗检+U-Net精分割)实现环数判定。系统采用多线程并行处理(时延<1秒)和亚像素边缘拟合(误差<0.04mm),支持切环判断和重叠弹孔处理,测试显示识别准确率>99.5%。方案包含在线增量学习机制,可动态优化模型性能,适用于射击训练实时评估场景。原创 2025-06-26 11:34:17 · 1156 阅读 · 0 评论 -
图像畸变的处理方案及如何计算畸变系数
本文介绍了计算机视觉中的图像畸变纠正技术。主要内容包括:1. 畸变类型及数学模型,分为径向畸变(k1,k2,k3)和切向畸变(p1,p2);2. 相机标定流程,使用棋盘格获取内参矩阵和畸变系数;3. Python实现方法,通过OpenCV进行角点检测、标定计算和图像校正。文章详细讲解了标定步骤、重投影误差评估以及实际应用示例,为消除镜头畸变提供了完整的解决方案。原创 2025-06-24 10:18:17 · 1789 阅读 · 0 评论 -
视觉图像处理及多模态融合初探
技术解决方案:使用 SLAM(Simultaneous Localization and Mapping)算法,如 ORB-SLAM 或 RTAB-Map,构建环境地图。:使用 OpenCV 库进行图像采集,利用滤波(如高斯滤波)、去噪(如中值滤波)、校正(如透视变换)等技术提升图像质量。技术解决方案:使用传感器融合算法(如卡尔曼滤波器)对视觉和其他传感器数据进行融合,解决时间同步和空间校准问题。技术解决方案:使用曲线拟合(如 Bezier 曲线)或样条插值(如 B 样条)对路径进行优化。原创 2025-05-08 09:26:01 · 2072 阅读 · 3 评论 -
研究关于视觉采集靶面弹孔识别,越打识别越准(二)
以下是利用 OpenCV 实现简单弹孔检测与自动标注的示例代码:traditional_automatic_labeling.py。不过,其对光照变化、图像噪声等因素较为敏感,可能会出现误检或漏检的情况。使用预训练的目标检测模型(如 YOLOv8)对少量图像进行人工标注并训练,然后用训练好的模型为新图像自动标注。需要有一定数量的人工标注数据来训练初始模型,不过一旦模型训练好,就能较为准确地为新图像进行标注。随着新的打靶数据不断产生,将新数据添加到数据集中,重新进行训练,让模型的识别精度随着训练不断提高。原创 2025-04-03 11:24:03 · 884 阅读 · 5 评论 -
yolov5 实时拉流usb摄像头有2000ms左右的延时处理思路
降低摄像头分辨率。使用较小的模型(如yolov5s利用 GPU 加速推理。优化摄像头图像读取和缓存管理。使用异步读取或多线程方法。原创 2025-01-11 17:20:16 · 1854 阅读 · 5 评论 -
人形识别及训练流程简要整理
强大的控制器:使用性能更强的控制器,如高性能的树莓派或工业级微型电脑,以确保能够快速处理摄像头图像和运行复杂的人形识别算法。图像预处理:在进行人形识别之前,对摄像头采集的图像进行预处理,如去噪、增强对比度、调整亮度等,以提高人形识别的准确性。可以考虑使用云台的反馈信息,如编码器的位置信息、电机的电流信息等,对云台的控制进行优化,以提高云台的稳定性和可靠性。对模型进行优化,如调整模型的架构、增加模型的深度和宽度、使用更先进的激活函数等,以提高模型的性能。使用大规模的数据集进行训练,以提高模型的泛化能力。原创 2024-10-12 15:59:37 · 1810 阅读 · 2 评论 -
python实现onvif协议下控制摄像头变焦,以及融合Mediapipe人形识别与跟踪控制
Onvif,即Open Network Video Interface Forum ,可以译为开放型网络视频接口论坛,是安迅士、博世、索尼在2008年共同成立的一个国际性、开发型网络视频产品标准网络接口的开发论坛,后来由于这个技术开发论坛共同制定的开发型行业标准,就用该论坛的大写字母命名,即ONVIF 网络视频标准规范,习惯简称为:ONVIF协议。这两天才因为项目需要,对网络摄像头的视频采集以及实现人形识别与跟踪技术。但是购买的摄像头是SONY网络头是用在其他地方的。#1024程序员节 | 征文#原创 2024-10-24 17:50:01 · 1805 阅读 · 6 评论 -
Win11下PyTorch安装一次3秒成功,实现GPU加速训练yolov5数据集
pipinstallxxx.whl安装两个包即可。CPU训练起来起来特别慢。在训练主机支持NVIDIA的情况下。开启GUP进行训练。这里不做具体赘述,主要说明CPU下配置切换到GPU加速训练。启动Pycharm,运行yolov5中的train.py。我的CUDAVersion是11.7。如下返回True则说明已经安装了cuda。CUDAVersion信息如下。配置完成后运行的效果显示cu117。原创 2025-01-07 17:29:09 · 788 阅读 · 3 评论 -
训练自己的数据集并通过cv2引用实现摄像头跟踪
可使用CVAT(计算机视觉标注工具)免费标注工具或者使用Labelimg,它是一种图形图像标注工具,用于使用图像中的边界框来标记对象。它是用 Python 编写的。你可以将标注导出为 PASCAL VOC 格式的 XML 文件。原创 2024-12-23 11:51:37 · 1385 阅读 · 0 评论 -
全面解析yolov5自主数据集模型训练的细则及训练后的数据集识别不到问题
全面解析yolov5自主数据集模型训练的细则及训练后的数据集识别不到问题原创 2024-12-31 16:01:12 · 1998 阅读 · 13 评论
分享