AI计算机视觉
文章平均质量分 78
人工智能、深度学习、计算机视觉技术分享和学习资料
殷忆枫
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于 PyQt5 和 OpenCV 的智能监控系统
本文介绍了一个基于PyQt5和OpenCV的智能监控系统Demo,支持多摄像头/RTSP流监控和YOLOv8目标检测。系统采用模块化设计,通过独立线程管理每个摄像头流,界面支持9路视频网格显示、双击全屏和AI检测开关功能。关键技术包括:1) 使用QThread实现多线程视频采集;2) 集成YOLOv8进行实时目标检测;3) PyQt5构建交互式GUI界面;4) 动态管理摄像头资源。系统还预留了日志查询和系统设置模块接口,具有较好的扩展性。该方案为智能监控系统开发提供了参考实现。原创 2025-09-17 09:02:18 · 1143 阅读 · 0 评论 -
AI学习笔记三十五:实时传输视频
若该文为原创文章,转载请注明原文出处。目的是实现视频的传输,只是个demo.程序分为两部分,视频接收端和视频发送端。原创 2025-08-08 11:21:16 · 448 阅读 · 0 评论 -
AI学习笔记三十四:基于yolov5+deepsort+slowfast的视频实时行为检测测试
SlowFast网络的基本思想是通过两个独立但相互连接的流来处理视频数据。Slow路径负责捕获空间语义信息,它以较低的帧率处理输入视频。Fast路径则以较高的帧率处理视频,能够捕捉快速运动信息。慢路径网络接收较少的帧数作为输入,用于捕捉空间语义信息快路径网络接收更多的帧,以较好的时间分辨率捕捉运动。可以通过减少Fast路径的通道容量,使其变得非常轻,同时学习有用的时间信息用于视频识别这两个网络通过特定的层进行信息交互,在每个阶段结束时进行。原创 2025-07-31 15:15:39 · 538 阅读 · 0 评论 -
AI学习笔记三十三:基于Opencv的单目标跟踪
主要是想实现跟踪视频中的一个特定目标。使用了OpenCV库来实现视频中特定目标的跟踪。需要提供视频文件路径以及目标在第一帧中的位置坐标(x, y, width, height),程序会自动跟踪该目标在整个视频中的移动。原创 2025-07-31 11:07:57 · 465 阅读 · 0 评论 -
AI学习笔记三十二:YOLOv8-CPP-Inference测试(Linux版本)
若该文为原创文章,转载请注明原文出处。主要介绍如何在Linux系统上安装和部署基于YOLOv8的C++推理项目。原创 2025-07-17 10:03:31 · 480 阅读 · 0 评论 -
AI学习笔记三十一:YOLOv8 C++编译测试(OpenVINO)
本文详细介绍了在Ubuntu 20.04系统上部署YOLOv8模型的完整流程。主要内容包括:1)安装OpenVINO 2025.0开发工具包,解决Python版本兼容问题;2)编译安装OpenCV 4.12.0;3)升级CMake至3.12版本;4)修改并编译YOLOv8 C++推理示例;5)在Windows环境下导出OpenVINO格式模型;6)解决运行时GLIBCXX版本缺失和图形界面依赖问题。通过逐步配置开发环境、处理依赖关系和解决常见错误,最终实现了YOLOv8在通用平台上的C++部署。该方案为RK原创 2025-07-16 17:18:31 · 1298 阅读 · 0 评论 -
AI学习笔记三十:基于yolov8的web显示
若该文为原创文章,转载请注明原文出处。原创 2025-07-03 19:00:05 · 871 阅读 · 0 评论 -
AI学习笔记二十九:YOLOV12部署测试
若该文为原创文章,转载请注明原文出处。先测试下yolov12,后面部署到RK3568上。本次测试使用的是win 10 ,无GPU,直接简单安装环境并使用CPU测试,数据集制作及训练后续介绍。原创 2025-06-05 16:54:30 · 639 阅读 · 0 评论 -
AI学习笔记二十八:使用ESP32 CAM和YOLOV5实现目标检测
若该文为原创文章,转载请注明原文出处。最近在研究使用APP如何显示ESP32 CAM的摄像头数据,看到有人实现把ESP32 CAM的数据流上传,通过YOLOV5来检测,实现拉流推理,这里复现一下。原创 2025-05-26 14:05:51 · 1347 阅读 · 0 评论 -
AI项目二十七:豆包大模型API测试
若该文为原创文章,转载请注明原文出处。代码是基于下面地址修改测试的, 如需源码,留下邮箱。原创 2025-02-15 14:28:10 · 2325 阅读 · 0 评论 -
AI项目二十六:YOLOV11简单部署测试
继YOLOv 8、YOLOv 9和YOLOv10之后,发布的YOLOV11引入了几个突破性的增强功能,为目标检测和计算机视觉设定了新的基准。增强的特征提取:YOLOv11使用改进的主干和颈部架构,显著提高了特征提取能力。这导致更准确的物体检测和更轻松地处理复杂视觉任务的能力。针对效率和速度进行了优化:凭借精致的架构设计和优化的训练管道,YOLOv11在保持高精度的同时提供更快的处理速度。这种平衡确保了YOLOv11是实时和大规模应用的理想选择。原创 2024-12-09 17:32:54 · 1140 阅读 · 0 评论 -
AI项目二十五:活体检测
若该文为原创文章,转载请注明原文出处。目的是想在RK3568上实现活体检测功能,查了一下,活体检测的方法常见的活体检测主要有以下3种方式:【1】配合式检测活体检测认证过程中,系统要求用户配合完成指定的的工作,比如眨眼、抬头、张嘴等动作,检测目标是否为真实的活题。【2】rgb检测此类检测方式,适用于阻挡用图片或者视频截图来欺骗人脸识别的攻击行为,通过识别图片上的细微特征来识别是否是真实活体,此类检测方式可分为在线和离线两种版本。【3】3D结构光检测。原创 2024-10-25 08:52:34 · 1565 阅读 · 4 评论 -
AI项目二十四:yolov10竹签模型,自动数竹签
若该文为原创文章,转载请注明原文出处。原本是为部署RK3568而先熟悉yolov10流程的,采用自己的数据集,网上很多,检测竹签,并计数。原创 2024-08-18 09:41:47 · 929 阅读 · 0 评论 -
AI项目二十三:危险区域识别系统
在IPC监控视频中,很多IPC现在支持区域检测,当在区域内检测到有人闯入时,发送报警并联动报警系统,以保障生命和财产安全具有重大意义。它能够在第一时间检测到人员进入危险区域的行为,并发出及时警告,从而防止潜在事故的发生。简单说是,在地图上标记出禁区(多边形),用计算机视觉技术监控进入禁区的物体。现在很多摄像头模组,都自带了移动侦测功能,比如海思,君正,RK等。以前有在RV1126上实现过类似的,现在想在RK3568上实现。记录下PC端测试情况。1、使用YOLOV5识别人物。原创 2024-06-18 23:23:36 · 1073 阅读 · 0 评论 -
AI项目二十二:行人属性识别
实现行人属性分析系统需要 3 个步骤:用 YOlOv5 识别行人用 ByteTrack 跟踪标记同一个人训练多标签图像分类网络,识别行人 26 个属性测试过程中由于使用的是CPU安装cython_bbox花了一点时间.环境搭建还是蛮麻烦的。如有侵权,或需要完整代码,请及时联系博主。原创 2024-06-15 16:16:52 · 2267 阅读 · 0 评论 -
AI项目二十一:视频动态手势识别
人工智能的发展日新月异,也深刻的影响到人机交互领域的发展。手势动作作为一种自然、快捷的交互方式,在智能驾驶、虚拟现实等领域有着广泛的应用。手势识别的任务是,当操作者做出某个手势动作后,计算机能够快速准确的判断出该手势的类型。本文将使用ModelArts开发训练一个视频动态手势识别的算法模型,对上滑、下滑、左滑、右滑、打开、关闭等动态手势类别进行检测,实现类似隔空手势的功能。在前面也有使用mediapipe实现类似功能。具体自行参考。本文章参考。原创 2024-05-01 11:05:43 · 5173 阅读 · 11 评论 -
AI项目二十:基于YOLOv8实例分割的DeepSORT多目标跟踪
若该文为原创文章,转载请注明原文出处。前面提及目标跟踪使用的方法有很多,更多的是Deepsort方法。本篇博客记录YOLOv8的实例分割+deepsort视觉跟踪算法。结合YOLOv8的目标检测分割和deepsort的特征跟踪,该算法在复杂环境下确保了目标的准确与稳定跟踪。在计算机视觉中,这种跟踪技术在安全监控、无人驾驶等领域有着广泛应用。原创 2024-04-28 14:14:16 · 3631 阅读 · 5 评论 -
AI项目十九:YOLOV8实现目标追踪
目标检测和目标跟踪的区别:目标检测任务要求同时完成对象的定位(即确定对象的边界框位置)和分类(即确定对象的类别)。这意味着目标检测算法必须不仅能够确定对象是否存在,还要知道它是什么。目标检测通常用于识别和定位图像或视频帧中的对象,通常需要明确的目标类别信息。目标跟踪任务更关注对象在帧与帧之间的连续性,通常更注重对象的运动特征,而不要求进行目标的分类。目标跟踪可以不涉及目标的类别,它的主要目标是维护对象的位置和轨迹,以实现在视频序列中的跟踪。原创 2023-12-24 18:01:39 · 7368 阅读 · 5 评论 -
AI项目十八:YOLOV8自训练关键点检测
若该文为原创文章,转载请注明原文出处。记录学习YOLOV8过程,自训练关键点检测模型。清华源:-i。原创 2023-12-16 19:16:21 · 7831 阅读 · 41 评论 -
AI项目十七:ResNet50训练部署教程
ResNet50网络是2015年由微软实验室的何恺明提出,获得ILSVRC2015图像分类竞赛第一名。在ResNet网络提出之前,传统的卷积神经网络都是将一系列的卷积层和池化层堆叠得到的,但当网络堆叠到一定深度时,就会出现退化问题。残差网络的特点是容易优化,并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接,缓解了在深度神经网络中增加深度带来的梯度消失问题。原创 2023-10-18 23:05:50 · 3344 阅读 · 1 评论 -
AI项目十六:YOLOP 训练+测试+模型评估
YOLOP是华中科技大学研究团队在2021年开源的研究成果,其将目标检测/可行驶区域分割和车道线检测三大视觉任务同时放在一起处理,并且在Jetson TX2开发板子上能够达到23FPS。论文标题:YOLOP: You Only Look Once for Panoptic Driving Perception论文地址: https://arxiv.org/abs/2108.11250官方代码: https://github.com/hustvl/YOLOP。原创 2023-10-13 21:51:35 · 1775 阅读 · 5 评论 -
AI项目十五:PP-Humanseg训练及onnxruntime部署
本文将PaddleSeg的人像分割(PP-HumanSeg)模型导出为onnx,并使用onnxruntime部署,实现人像分割,效果如下图所示。原创 2023-10-11 23:28:18 · 1106 阅读 · 0 评论 -
Ai项目十四:基于 LeNet5 的手写数字识别及训练
pytorch复现lenet5模型,并检测自己手写的数字图片。利用torch框架搭建模型相对比较简单,但是也会遇到很多问题,网上资料很多,搭建模型的方法大同小异,在我尝试了自己搭建搭建出来模型,无论是训练还是检测都会遇到很多的问题,像这种自己遇到的问题,请教别人也没有用。原创 2023-10-03 17:10:24 · 433 阅读 · 0 评论 -
AI项目十三:PaddleOCR训练自定义数据集
若该文为原创文章,转载请注明原文出处。续上一篇,PaddleOCR环境搭建好了,并测试通过,接下来训练自己的检测模型和识别模型。原创 2023-09-30 22:04:33 · 2042 阅读 · 5 评论 -
AI项目十二:PaddleOCR环境搭建及测试
OCR识别分为两部分,一是检测出文字,二是识别出文字。PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。PaddleOCR是一款文本识别效果不输于商用的Python库!在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。原创 2023-09-30 09:14:40 · 1116 阅读 · 2 评论 -
AI项目十一:Swin Transformer训练
若该文为原创文章,转载请注明原文出处。续上一篇,训练自己的数据集,并测试。原创 2023-09-28 21:29:17 · 692 阅读 · 0 评论 -
AI项目十:Swin Transformer目标检测环境搭建
若该文为原创文章,转载请注明原文出处。原创 2023-09-28 21:06:45 · 1602 阅读 · 5 评论 -
AI项目九:实例分割
计算机视觉分为四大基本任务(分类、定位、检测、分割)。而这里了解了一下实例分割。机器自动从图像中用目标检测方法框出不同实例,再用语义分割方法在不同实例区域内进行逐像素标记借一个浅显的说法:语义分割不区分属于相同类别的不同实例。例如,当图像中有多只猫时,语义分割会将两只猫整体的所有像素预测为“猫”这个类别。与此不同的是,实例分割需要区分出哪些像素属于第一只猫、哪些像素属于第二只猫。这里以猫为例,基本思路:目标检测+语义分割。原创 2023-09-26 07:02:52 · 535 阅读 · 0 评论 -
AI项目八:yolo5+Deepsort实现目标检测与跟踪(CPU版)
DeepSORT 是一种计算机视觉跟踪算法,用于在为每个对象分配 ID 的同时跟踪对象。DeepSORT 是 SORT(简单在线实时跟踪)算法的扩展。DeepSORT 将深度学习引入到 SORT 算法中,通过添加外观描述符来减少身份切换,从而提高跟踪效率。这是提供两个demo,一是跟踪计数人员;二是车辆计数跟踪;原创 2023-09-18 22:21:04 · 1573 阅读 · 2 评论 -
AI项目七:WEB端部署YOLOv5
最近接触网页大屏,所以就想把YOLOV5部署到WEB端,通过了解,知道了两个方法:1、基于Flask部署YOLOv5目标检测模型。2、基于Streamlit部署YOLOv5目标检测。代码在github上,个人感觉两个比较好的,所以基于两份代码测试。Streamlit 是一个用于数据科学和机器学习的开源 Python 框架。它提供了一种简单的方式来构建交互式应用程序,使数据科学家和机器学习工程师可以更轻松地将他们的模型展示给其他人。st.write():打印文本、数据框、图表等。st.title()原创 2023-09-12 23:05:15 · 5483 阅读 · 26 评论 -
AI项目六:基于YOLOV5的CPU版本部署openvino
通过openvino加速,CPU没有GPU下,从原本的20帧左右提升到50多帧,效果还可以,就 是用自己的模型,训练出来的效果不怎么好。使用树莓派等嵌入板子使用openvino效果还可以。如有侵权,或需要完整代码,请及时联系博主。原创 2023-09-12 12:50:54 · 1519 阅读 · 2 评论 -
AI项目五:结印动作识别
若该文为原创文章,转载请注明原文出处。原创 2023-09-10 14:40:52 · 686 阅读 · 2 评论 -
AI项目四:基于mediapipe的钢铁侠操作(虚拟拖拽)
在B站看到使用CVZone进行虚拟物体拖放,模仿钢铁侠电影里的程序操作!_哔哩哔哩_bilibili是使用CVZone方式实现的,代码教程来源https://www.computervision.zone,感兴趣可以测试一下根据这个功能,用mediapipe实现了相同的效果。原创 2023-08-27 10:29:09 · 375 阅读 · 0 评论 -
AI项目三:基于mediapipe的虚拟绘画
随着人工智能时代的到来,许多技术得到了空前的发展,让人们更加认识到了线上虚拟技术的强大。通过mediapipe识别手的关键点,检测中指,实现隔空画画的操作。通过两个手指的间距,实现点击选择颜色或橡皮檫。原创 2023-08-20 11:30:21 · 748 阅读 · 0 评论 -
AI项目二:基于mediapipe的虚拟鼠标控制
由于博主太懒,mediapipe如何实现鼠标控制的原理直接忽略,最初的想法是想控制摄像头识别手指控制鼠标,达到播放电影的效果。基本上效果也是可以的。简单的说是使用mediapipe检测出手指的关键点,通过检测食指关键点去移动鼠标,当食指和中指距离小于一定值,当成点击事件处理。原创 2023-08-16 22:57:21 · 1675 阅读 · 0 评论 -
AI项目一:mediapipe测试
若该文为原创文章,转载请注明原文出处。原创 2023-08-13 09:29:26 · 636 阅读 · 0 评论 -
AI学习笔记四:yolov5训练自己的数据集
若该文为原创文章,转载请注明原文出处。一般情况下,大部分人的电脑都是没有cpu的,cpu也是可以训练的,但花费的时间太长,实际200张图片,使用CPU训练300轮花了3天,本章记录使用云服务器来训练自己的数据集。使用的云服务器是AutoDL,一直在使用,性价比还是比较高的。原创 2023-07-26 22:06:35 · 2588 阅读 · 3 评论 -
AI学习笔记三:编写检测的yolov5测试代码
通过detect.py代码测试通过后,阅读detect.py代码发现,有些难以看懂,看得有点蒙蒙的,执行时,如果提示一些module没有安装,直接使用pip install安装。xmin ymin xmax ymax: 对应了坐标。运行后,会把结果保存成results.jpg图片。如有侵权,或需要完整代码,请及时联系博主。若该文为原创文章,转载请注明原文出处。所以编写了一个简单的测试程序。原创 2023-07-25 20:12:22 · 663 阅读 · 0 评论 -
AI学习笔记二:YOLOV5环境搭建及测试全过程
若该文为原创文章,转载请注明原文出处。记录yolov5从环境搭建到测试全过程。原创 2023-07-25 19:54:29 · 3321 阅读 · 6 评论 -
AI学习笔记一:软件和环境搭建
AI计算机视觉:软件和环境搭建原创 2023-07-25 14:45:57 · 421 阅读 · 0 评论
分享