YOLO计算机视觉应用
文章平均质量分 86
围绕计算机视觉应用领域,探索YOLO的应用
alpszero
从事智能交通行业多年,熟悉网络通信、计算机视觉技术、技术管理等领域
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
YOLO26来了
YOLO26是YOLO系列最新轻量级目标检测器,专为边缘设备优化设计。它采用端到端无NMS架构,简化部署流程并降低延迟;移除DFL模块提升硬件兼容性;引入ProgLoss+STAL损失函数和MuSGD优化器(融合SGD与Muon技术),显著提升小物体检测精度和训练效率。支持检测、分割、姿态估计等多项任务,CPU推理速度提升高达43%,在640像素分辨率下mAP达53.0,参数仅24.8M。该模型特别适合物联网、机器人等资源受限场景。原创 2025-10-27 09:13:09 · 1220 阅读 · 0 评论 -
使用Ultralytics YOLO导出模型
YOLO11导出模式提供多种格式转换功能,支持将训练好的模型部署到不同平台。通过简单命令或代码即可导出为ONNX、TensorRT等格式,实现CPU/GPU性能优化(最高提升3-5倍)。导出参数可定制输入尺寸、量化精度等,满足硬件兼容性和推理效率需求。支持导出为12种格式(如TensorFlow Lite、CoreML等),均保留模型元数据。关键优势包括:一键导出、批量推理优化、动态尺寸支持,适用于边缘计算到云端部署的各类场景。原创 2025-09-22 14:10:54 · 964 阅读 · 0 评论 -
使用通义视觉理解大模型API进行图片分析
阿里云百炼平台提供全链路大模型服务,支持开发者快速构建AI应用。本文介绍了如何调用通义千问VL视觉理解大模型API,包括注册账号、获取API Key、环境配置等初始设置步骤。该模型支持图像问答、数学解题、视频理解等多种功能,可通过在线图像或本地文件两种方式调用API。文章提供了详细的Python代码示例,演示如何通过DashScope SDK处理本地文件的多模态查询,包括图像识别和分析功能。测试代码部分展示了处理用户查询的完整流程,包括JSON解析和API调用。原创 2025-09-15 11:16:16 · 1430 阅读 · 0 评论 -
使用YOLO11进行路面裂缝检测
本文介绍了使用YOLO11模型进行路面裂缝检测的方法。通过创建Conda环境并安装必要的深度学习工具包,作者使用包含1750张标注图片的数据集,分别训练了yolo11n和yolo11s模型。训练结果显示,两个模型都能有效识别路面裂缝,其中yolo11s表现更优。文章提供了详细的训练参数设置、评估指标和检测效果图,证明该方法可用于路面状况检测和维修评估。原创 2025-09-09 11:11:09 · 398 阅读 · 0 评论 -
使用YOLO11训练花卉分类模型
本文介绍了使用YOLO11训练花卉分类模型的全过程。首先讲解了图像分类的基本概念及应用场景,然后详细说明了使用Conda配置GPU训练环境的步骤,包括创建虚拟环境、安装Ultralytics及相关依赖。接着介绍了包含9种花卉的数据集准备情况。文章重点展示了使用YOLO11n、s、m三种预训练模型进行训练的过程和结果对比,并提供了测试推理代码示例。最后展示了部分测试结果图片,验证了模型对雏菊、玫瑰等花卉的准确识别能力。整个流程覆盖了从环境配置到模型训练、测试的完整周期。原创 2025-09-05 20:09:09 · 776 阅读 · 0 评论 -
使用YOLO11训练鸟类分类模型
本文介绍了使用YOLO11训练鸟类分类模型的过程。首先概述了图像分类任务的基本概念和应用场景,然后详细说明了使用Conda准备训练环境的步骤,包括创建环境、安装必要软件包等。文章展示了一个包含12种鸟类的数据集及其样本图片,并比较了YOLO11不同规模预训练模型的性能指标。通过Python代码进行了模型训练,展示了n、s、m三种模型的训练结果图表。最后提供了测试推理代码和部分识别结果示例图片,验证了模型的有效性。整个过程涵盖了从环境搭建、数据处理到模型训练和测试的全流程。原创 2025-09-05 20:04:35 · 1304 阅读 · 0 评论 -
使用YOLOv13进行钢板表面缺陷检测
本文在前期采用YOLO11和YOLOv12模型进行钢板表面六种缺陷检测的基础上,进一步使用相同数据集训练了YOLOv13模型。实验结果显示,YOLOv13n和YOLOv13s两种变体模型均取得了良好的训练效果,相关性能指标通过图表展示。该研究为工业质检领域提供了新的目标检测解决方案,验证了YOLOv13模型在钢板缺陷检测任务中的适用性。原创 2025-08-14 11:24:26 · 665 阅读 · 0 评论 -
使用YOLOv12进行钢板表面缺陷检测
文章摘要:本文对比了YOLOv12n和YOLOv12s模型在钢板表面缺陷检测任务上的训练效果。基于前期使用YOLO11对6种钢板缺陷进行训练的数据集(见参考链接),作者展示了两种YOLOv12变体的训练结果可视化图表。文中附带了两个模型训练过程的性能曲线图,直观展示了模型的学习效果。原创 2025-08-14 11:21:54 · 181 阅读 · 0 评论 -
使用YOLO11进行钢板表面缺陷检测
本文基于东北大学的钢板表面缺陷数据集,采用YOLO11算法进行缺陷检测研究。数据集包含裂纹、杂质、斑块等6类缺陷,经分析显示各类别分布不均衡。通过对比YOLO11n、11s和11m三个模型发现:11s模型在速度与精度间取得最佳平衡,尤其对小目标(如裂纹)检测效果较好。研究表明该算法适用于工业质检系统验证,但实际应用仍需扩充数据以提高检测性能。研究为智能化钢材表面缺陷检测提供了可行方案,具有工程应用价值。原创 2025-07-24 10:19:30 · 590 阅读 · 0 评论 -
YOLO13:基于超图增强自适应视觉感知的实时目标检测
YOLOv13:超图增强的实时目标检测新突破 YOLOv13提出了一种创新的实时目标检测框架,通过超图自适应相关增强(HyperACE)技术,将多尺度特征像素建模为超图顶点,利用可学习超边构建高阶相关性,实现高效视觉感知。该模型采用全流程聚合-分发范式(FullPAD)优化信息流传递,结合深度可分离卷积实现轻量化设计。实验表明,YOLOv13在MS COCO数据集上取得显著优势,其Nano版本AP50达到57.8,Small版本AP50达65.2,均优于同类先进模型,同时保持较低的计算开销和延迟。原创 2025-07-24 10:14:12 · 876 阅读 · 0 评论 -
Ultralytics YOLO超参数调整指南(二)
本文介绍了使用Ultralytics YOLO进行超参数调整的方法。主要内容包括:1)如何定义搜索空间并使用model.tune()方法进行超参数调整;2)如何恢复中断的调整会话;3)调整完成后生成的结果文件结构及其用途说明,包括最佳超参数文件、性能图表和权重文件等。文中提供了完整的代码示例和文件结构说明,帮助用户通过遗传算法优化YOLO模型的性能。该调整过程简单高效,适合系统性地提升模型表现。原创 2025-06-29 13:34:53 · 1243 阅读 · 0 评论 -
Ultralytics YOLO超参数调整指南(一)
摘要:本文介绍了Ultralytics YOLO的超参数调整方法,重点讲解了遗传算法优化过程。内容包括超参数类型(如学习率、批量大小等)、调整步骤(初始化、变异、训练、评估)以及默认搜索空间参数(数值范围及功能说明)。文章强调超参数调整需要确定评估指标、设置计算资源预算,并通过迭代优化模型性能。默认参数表格详细列出了20个关键参数及其取值范围,为YOLO模型优化提供了实用参考。原创 2025-06-28 21:28:32 · 1293 阅读 · 0 评论 -
使用Ultralytics YOLO进行数据增强
数据增强是计算机视觉领域的一项重要技术,它通过对现有图像进行各种转换,人为地扩展训练数据集。在训练深度学习模型时,数据增强有助于提高模型的鲁棒性,减少过拟合,并增强对真实世界场景的泛化。Ultralytics YOLO 提供了一整套增强技术,每种技术都有特定的用途,并以不同的方式提高模型性能。本文主要描述在检测推理时常用的数据增强功能。原创 2025-06-27 19:46:11 · 1233 阅读 · 0 评论 -
在树莓派上使用YOLO11推理
摘要:Raspberry Pi因其低成本、紧凑性和多功能性,成为计算机视觉项目的理想平台。本文介绍了在Raspberry Pi上安装Ultralytics YOLO模型的两种方法(Docker和非Docker),推荐使用YOLO11n/s等轻量模型。重点讲解了如何将模型转换为NCNN格式提升推理性能,以及通过Picamera2或TCP流实现摄像头实时推理的方案。最佳实践包括使用SSD替代SD卡、选择无图形界面系统、合理超频等优化措施,充分发挥Raspberry Pi在边缘计算中的潜力。(150字)原创 2025-06-26 21:19:37 · 1632 阅读 · 0 评论 -
使用YOLO模型进行线程安全推理
在多线程环境中使用YOLO模型时,线程安全至关重要。文章指出共享单例模型实例会导致竞赛条件,建议在每个线程内独立实例化YOLO模型以确保线程安全。同时介绍了Ultralytics提供的ThreadingLocked装饰器,通过加锁机制实现共享模型实例的线程安全调用。此外,还建议考虑使用多进程并行处理或任务队列来进一步优化性能。关键结论是:避免跨线程共享模型实例,采用线程隔离或加锁机制,必要时可转向多进程方案,以确保多线程环境下YOLO模型推理的可靠性和稳定性。原创 2025-06-18 19:59:28 · 1210 阅读 · 0 评论 -
在VSCode中使用Ultralytics扩展
VS Code 的 Ultralytics-snippets 扩展是一款提升开发效率的工具,专为 Ultralytics 应用开发设计。该扩展通过智能代码补全、预置代码片段和自动化任务,帮助开发者快速编写高质量代码。主要功能包括:1)一键插入常用代码模板(如模型初始化、结果处理);2)支持自定义变量名和快速导航;3)覆盖关键参数、示例代码等实用类别;4)兼容 YOLO、SAM 等多种模型。安装后输入前缀「ultra」即可调用,显著简化开发流程,是高效构建 Ultralytics 应用的得力助手。原创 2025-06-08 19:10:02 · 1542 阅读 · 0 评论 -
YOLO11解决方案之分析
Ultralytics基于YOLO11提供了多种现实世界解决方案,包括物体计数、追踪和安全监控等功能。它支持三种数据可视化类型:折线图(适合趋势分析)、条形图(适合类别对比)和饼图(适合比例展示)。该框架提供Python API,可处理视频流并实时生成分析结果,参数包括检测置信度、跟踪算法选择和可视化选项。不同分析类型(线图、面积图、条形图、饼图)均可直观展示检测数据,适用于安防监控、交通分析等多种场景。原创 2025-06-07 17:29:07 · 951 阅读 · 0 评论 -
使用FastAPI构建车牌检测识别服务
本文介绍了基于YOLOv11和CRNN的车牌检测识别系统。系统采用YOLOv11进行高效车牌检测,通过CCPD数据集训练获得高精度模型。识别部分使用CRNN网络,在多种车牌数据集上训练,实现准确的车牌内容识别。核心代码封装在PlateRecognizer类中,包含检测识别、结果标注等功能。该系统借助深度学习技术,实现了从输入图像到车牌识别的完整流程,具有较高的实用性和准确性,适用于多种实际应用场景。原创 2025-06-02 20:06:07 · 1172 阅读 · 0 评论 -
YOLO11解决方案之语义图像搜索
本方案使用OpenAI CLIP、Meta FAISS 构建语义图像搜索引擎,通过将 CLIP 强大的可视化语言嵌入与 FAISS 高效的近邻搜索相结合,使用自然语言查询检索相关图像。本方案使用Flask构建演示WEB Server,建立了一个功能齐全的WEB图像搜索系统。原创 2025-05-27 11:13:53 · 980 阅读 · 0 评论 -
YOLO11解决方案之区域追踪探索
TrackZone 用来监控指定区域内的目标,而不是整个画面,它基于 Ultralytics YOLO11,专门在视频和实时摄像机传输的区域内集成了目标检测和跟踪功能。YOLO11 TrackZone 的先进算法和深度学习技术使其成为实时应用的完美选择,可在人群监控和安防等应用中提供精确、高效的目标跟踪。原创 2025-05-25 21:04:57 · 1385 阅读 · 0 评论 -
YOLO11解决方案之使用 Streamlit 应用程序进行实时推理
Streamlit 使构建和部署交互式网络应用程序变得简单,将其与Ultralytics YOLO11 结合使用,可以直接在浏览器中进行实时对象检测和分析。YOLO11 的高精度和高速度确保了实时视频流的流畅性能,能够帮助用户快速分析视频流。原创 2025-05-24 16:33:03 · 869 阅读 · 0 评论 -
YOLO11解决方案之速度估算探索
YOLO11速度估计结合物体检测与跟踪技术,通过计算物体在帧间的移动距离和帧频来估算速度,适用于交通分析、自动驾驶和安全分析等场景。本文展示了如何使用Python实现速度估计的演示界面,支持在图像中画线或框,并输出叠加了类别和速度的视频。文章还介绍了基于Tkinter的GUI演示程序,用户可以通过界面打开视频文件、绘制检测区域,并实时查看物体速度信息。原创 2025-05-23 20:29:00 · 1271 阅读 · 0 评论 -
YOLO11解决方案之VisonEye对象映射
Ultralytics的VisionEye解决方案利用YOLO模型实现物体识别与跟踪,模拟人眼视角,从固定点聚焦并绘制物体路径。其核心功能包括物体检测、跟踪和空间关系可视化,适用于安防监控、零售分析、运动分析、自动驾驶及人机交互等场景。通过结合距离计算或速度估算,VisionEye可构建更复杂的综合系统。演示代码展示了如何使用VisionEye处理视频,并实时显示物体与视觉点之间的距离。原创 2025-05-21 13:24:14 · 1445 阅读 · 0 评论 -
YOLO11解决方案之实例分割与跟踪探索
实例分割是一项计算机视觉任务,涉及在像素级别识别和勾勒图像中的单个对象。与只按类别对像素进行分类的语义分割不同,实例分割对每个对象实例进行唯一标记和精确划分,因此对于需要详细空间理解的应用(如医疗成像、自动驾驶和工业自动化)来说至关重要。原创 2025-05-19 20:42:06 · 1510 阅读 · 0 评论 -
YOLO11解决方案之锻炼监测探索
在运动评估方面,YOLO11能够实时准确地跟踪身体关键点和关节,提供即时反馈、跟踪锻炼程序并测量性能指标,从而优化训练课程。文章还提供了使用YOLO11进行锻炼监测的演示代码,并详细介绍了YOLO11姿势模型中的17个关键点及其对应的人体部位。此外,文章还讨论了AIGym参数设置,包括基本参数、物体跟踪参数和可视化参数,并通过仰卧起坐和跳绳的测试效果展示了如何调整参数。原创 2025-05-18 09:39:11 · 1468 阅读 · 0 评论 -
YOLO11解决方案之对象裁剪探索
对象裁剪是指从图像或视频中分离并提取特定的检测对象,YOLO11 模型功能可用于准确识别和划分物体,从而实现精确裁剪,以便进一步分析或处理。使用YOLO11 可以方便的对目标对象进行裁剪,可对场景中的单个项目进行深入检查或处理,同时可以显著降低数据量,方便传输和存储。原创 2025-05-16 20:32:42 · 478 阅读 · 0 评论 -
YOLO11解决方案之距离计算探索
测量两个物体之间的间距被称为特定空间内的距离计算,YOLO11使用两个边界框的中心点计算距离。使用距离计算,可以提供计算机视觉任务中比较精确的空间定位,分析视频环境中的对象关系,通过监控移动物体之间的距离,使系统能够检测到潜在的碰撞,为自动驾驶或者交通监控等应用提供更好的空间场景理解能力。原创 2025-05-15 21:58:07 · 1259 阅读 · 0 评论 -
YOLO11解决方案之队列管理探索
队列管理涉及组织和控制排队的人员或车辆,以减少等待时间并提高效率。在市内交通、港口、零售、机场及其他服务业等各种环境中,它涉及优化队列,以提高客户满意度和系统性能。YOLO11队列管理可提供队列长度和等待时间的即时数据,使管理人员能够快速做出明智决策。原创 2025-05-15 15:40:04 · 908 阅读 · 0 评论 -
YOLO11解决方案之热力图探索
使用YOLO11生成的热力图把复杂的数据转换成生动的彩色编码矩阵。这种可视化工具采用色谱来表示不同的数据值,暖色调表示较高的强度,冷色调表示较低的值。热力图在可视化复杂的数据模式、相关性和异常情况方面表现出色,为不同领域的数据解读提供了一种直观可视化方法。原创 2025-05-14 20:58:03 · 1301 阅读 · 0 评论 -
YOLO11解决方案之物体模糊探索
物体模糊是指对图像或视频中的特定检测对象应用模糊处理,这可以利用YOLO11 模型的功能来识别和处理给定场景中的物体,保护隐私权或隐藏敏感信息。原创 2025-05-13 22:17:17 · 764 阅读 · 0 评论 -
YOLO11解决方案之物体计数探索
YOLO11 在实时应用中表现出色,凭借其先进的算法和[深度学习](https://www.ultralytics.com/glossary/deep-learning-dl)能力,可为人群分析、交通分析和移动监控等各种场景提供高效、精确的物体计数。本文使用Python实现了简单的演示界面,可以在图像中画线或者框,运行推理,输出计数结果。原创 2025-05-10 18:39:13 · 1822 阅读 · 0 评论 -
YOLO11预测返回结果plot方法解析
YOLO11 predict()返回Results对象,检测任务的主要数据包括原始图像、原图像尺寸、边界框、类别及其置信度、xywh(中心坐标、宽度和高度)及其归一化数据、xyxy(左上、右下坐标)及其归一化数据。其他任务的推理返回结果包含其特定的数据。原创 2025-05-08 20:37:35 · 3455 阅读 · 0 评论 -
使用YOLO11-OBB进行停车场检测
OBB定向物体检测在标准物体检测基础上,引入了一个额外的角度来更准确地定位图像中的物体,能够更准确的预测物体的形状、运动方向等特征。原创 2025-05-05 17:53:18 · 1745 阅读 · 0 评论 -
YOLO11-classify预测返回结果分析
图像分类是YOLO任务中最简单的一项,涉及将图像内容归入一组预定义类别中的某一类。图像分类器的输出是单一类别标签和置信度分数。当你只需要知道图像属于哪一类,而不需要知道该类对象的位置或确切形状时,图像分类就非常有用。原创 2025-05-01 13:31:03 · 1323 阅读 · 0 评论 -
YOLO11-SEGMENT预测返回结果分析
实例分割模型的输出是一组勾勒出图像中每个物体的遮罩或轮廓,以及每个物体的类标签和置信度分数。当你不仅需要知道物体在图像中的位置,还需要知道它们的具体形状时,实例分割就非常有用了。原创 2025-04-30 08:20:39 · 2085 阅读 · 0 评论 -
YOLO11-POSE预测返回结果分析
姿态估计是一项涉及识别图像中特定点(通常称为关键点)位置的任务。关键点可以代表物体的各个部分,如关节、地标或其他显著特征。关键点的位置通常用一组二维 [x, y] 或 三维 [x, y, visible] 坐标。原创 2025-04-28 15:02:50 · 1677 阅读 · 0 评论 -
YOLO11-OBB预测返回结果分析
相比标准物体检测,OBB引入了一个额外的角度来更准确地定位图像中的物体,预测输出是一组精确包围图像中物体的旋转边界框。当物体以不同角度出现时,定向边界框尤其有用,例如在航空图像中,传统的轴对齐边界框可能会包含不必要的背景。YOLO-obb 预测返回的是Python list类型的 Results 对象,包含的数据项很多,结构比较复杂,本文进行详细介绍。原创 2025-04-27 20:24:58 · 1869 阅读 · 0 评论 -
YOLO11预测返回结果分析
YOLO 预测返回的是Python list类型的 Results 对象,包含的数据项很多,比较复杂。本文主要分析检测推理返回结果。原创 2025-04-25 10:40:08 · 1537 阅读 · 0 评论 -
使用YOLO11进行停车场检测模型训练
本次训练主要针对停车场停放车辆和空位进行检测。检测空位主要是学术方面的需求,在实际工程应用中,只检测出停放的车辆就可以了。本次训练的模型对规则的停车场的检测效果达到很好的水平。原创 2025-04-21 10:04:07 · 869 阅读 · 0 评论 -
YOLO数据集格式介绍
YOLO支持多种数据集支持计算机视觉任务,包括检测(detection)、实例分割(instant segmentation)、姿态估计(pose estimation)、物品分类( classification)、多目标跟踪( multi-object tracking)。数据集种类繁多,格式也比较多,很多人会比较迷惑,这里把Ultralytics官网相关内容整理在一起,以便读者对各种数据集有一个全面认识。原创 2025-04-19 09:40:25 · 3380 阅读 · 0 评论
分享