道心-优快云博客

原创 YOLOv12—以注意力为中心的实时对象检测器

本研究成功将以注意力为核心的设计引入YOLO框架，提出YOLOv12，在实时目标检测的延迟 - 精度权衡方面取得了最先进的成果。为实现高效推理，设计了新颖的网络，利用区域注意力降低计算复杂度，通过残差高效层聚合网络（R - ELAN）增强特征聚合。同时，对普通注意力机制的关键组件进行优化，使其更好地适应YOLO的实时约束，保持高速性能。通过有效结合区域注意力、R - ELAN和架构优化，YOLOv12在精度和效率上均实现了显著提升。全面的消融研究进一步验证了这些创新的有效性。

2025-02-25 12:57:54 1374

原创 YOLOv12保姆级教程（win系统和ubuntu系统均可使用）

YOLOv12 是由纽约大学、中国科学院大学和布法罗大学联合研发的实时物体检测模型。相比传统的 CNN 架构，YOLOv12 引入了注意力机制，突破了在捕捉全局依赖和提升精度方面的局限。其创新包括：区域注意力模块（A2）：提高推理速度，减少计算复杂度。残差高效层聚合网络（R-ELAN）：增强特征聚合，优化训练效率。架构优化：采用 FlashAttention 解决内存访问问题，调整 MLP 比率，进一步提升性能。

2025-02-20 00:07:30 8050 30

原创 U-Net 与深度学习的完美结合：图像分割的高效解决方案

本文深入解析了 U-Net 模型的结构与应用，特别是在医学图像分割中的优势。我们介绍了 U-Net 的编码器、解码器及跳跃连接设计，阐述了卷积、池化、上采样等核心操作及损失函数（如 Dice 系数与交叉熵）。此外，提供了基于 PyTorch 的 U-Net 实现代码，涵盖数据预处理、模型训练、优化与评估。通过实际代码，读者可以了解如何高效训练 U-Net 模型，并应用于实际的图像分割任务。

2025-02-19 02:48:35 1293 2

原创什么是具身智能？《让网络空间与物理世界保持一致：具身智能综述》

这篇论文《Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI》详细阐述了具身人工智能（Embodied AI）的发展现状，特别是在多模态大模型（MLM）和世界模型（WM）技术推动下的进展。具身人工智能被认为是实现通用人工智能（AGI）的关键途径之一。本文不仅深入探讨了具身感知、具身交互和具身智能体的最新技术，还分析了虚拟环境与物理环境的对接，展示了具身AI在现实世界中的重要应用。

2025-02-19 01:33:42 1238

原创解决YOLO-seg分割出现接触点异常突起：从单一接触点平滑到贝塞尔曲线替换

第一部分输入中的.txt文件（YOLOv5-seg 格式）。读取：用，只提取多边形坐标。处理计算多边形的外接框bbox；根据bbox找到多边形的第一个接触点；对除了该接触点之外的点进行高斯平滑；输出：用写到中间文件夹。第二部分输入：第一阶段中间文件夹里的.txt；读取：用，这次返回列表；处理找多边形的最长边-> 用二次贝塞尔曲线替换；可选：再次高斯平滑（即重算bbox；输出：写到。这样，两部分就串行执行，自动化完成。通过这样一份整合脚本，我们实现了多步自动化。

2025-01-22 04:50:12 653

原创 Hyper-YOLO保姆级教程

Hyper-YOLO 是基于超图思想的下一代目标检测框架，通过在特征提取与语义表示中引入高阶关系推理，大幅度提升了检测精度与跨尺度、跨位置的特征交互效率。本文以“保姆级”手把手教程的形式，详细介绍了从环境搭建、代码下载到数据集准备与可视化训练的整个流程——包括如何利用 Anaconda 创建虚拟环境、安装 PyTorch (CPU/GPU 版本) 以及 ultralytics 环境；如何按照 YOLO 系列的常见格式制作训练数据；以及如何执行训练、验证和推理脚本等操作，并提供了完整的下载资源，轻松上手。

2024-12-22 03:13:50 3338 20

原创如何批量运行YOLOv8模型验证：全面指南及脚本解析

在深度学习项目中，训练多个模型版本以优化性能是常见的做法。随着模型数量的增加，手动验证每个模型的性能不仅耗时，而且容易出错。为了提高效率，自动化批量验证过程显得尤为重要。本文将介绍如何使用Python脚本批量运行YOLOv8模型的验证，并将验证结果组织到指定的文件夹中，方便后续分析和管理。遍历训练目录：自动查找所有包含文件的子文件夹。加载模型：使用Ultralytics YOLO库加载每个模型。运行验证：对每个模型运行验证，并将结果保存到指定的输出目录。打印详细信息。

2024-12-09 16:17:19 905

原创 YOLO-seg 的 TXT 格式的标注并保存图像【标签可视化】【YOLO分割】

YOLO-seg 的标注文件使用.txt格式，其中每一行描述一个目标。class_id：目标的类别索引（从0开始）。：目标框的中心坐标，归一化到[0, 1]范围内。：目标框的宽度和高度，归一化到[0, 1]范围内。：目标的分割多边形顶点坐标，顶点的x, y坐标也归一化到[0, 1]范围内，并以空格分隔。示例标注文件内容。

2024-12-03 15:21:18 1745

原创如何利用自动化脚本高效批量训练多个rt-detr模型

随着深度学习技术的快速发展，模型的训练变得更加复杂和多样化。在这种情况下，自动化训练流程的实现显得尤为重要。通过批量生成并运行训练脚本，算法工程师可以高效地完成模型实验，而无需陷入繁琐的手动操作中。这种自动化的流程不仅能提高工作效率，还能帮助团队在有限的时间和资源下，快速迭代并优化模型。

2024-12-03 14:12:04 1163

原创使用YOLO系列txt目标检测标签的滑窗切割：批量处理图像和标签的实用工具

该代码实现了对大图像及其对应标签的滑窗切割，并确保切割后的标签正确地被裁剪并保存。它通过对图像和标签的逐块切割，将大图像分割成多个较小的图像块，同时调整标签的位置和大小，以符合新的图像尺寸。加载图像和标签：读取图片和标签文件，确保标签与图像对应。滑窗切割：以给定的窗口大小和步长，对图像进行滑窗切割。裁剪标签：对于每个切割窗口，检查标签是否位于窗口内，如果位于窗口内，调整标签坐标，并确保标签归一化。保存切割后的图像和标签：将切割后的图像和标签保存到新的文件夹中。

2024-12-01 20:21:58 1225

原创目标检测中数据集格式之间的相互转换--coco、voc、yolo

正确理解和掌握COCO、VOC和YOLO三种数据集格式之间的相互转换机制，不仅能够帮助研究者和开发人员提高工作效率，而且有助于深入理解各种目标检测算法对数据的不同处理方式和需求。本文将详细介绍这三种常见的数据集格式，探讨它们之间的转换方法，并提供实用的代码示例和操作指南，旨在帮助读者轻松应对目标检测中的数据集格式转换问题。

2024-09-09 01:14:40 5709

原创 YOLO系列目标分割txt格式数据增强（YOLOv5-seg YOLOv6-seg YOLOv7-seg YOLOv8-seg YOLOv9-seg YOLOv10-seg）

本文将深入探讨在使用YOLO系列目标分割模型（如YOLOv5-seg至YOLOv10-seg）时，如何通过TXT格式的数据增强来优化训练过程。我们会从数据增强的必要性谈起，进而详细介绍几种高效的数据增强技巧，最后探讨如何将这些技巧应用于YOLO系列的分割任务中，以期为读者提供一份实操性强、易于理解且高效的数据增强指南，帮助他们在目标分割领域取得更佳的研究成果和应用效果。

2024-09-09 00:33:47 1884

原创 YOLO系列目标检测XML格式转TXT格式（YOLOv5 YOLOv6 YOLOv7 YOLOv8 YOLOv9 YOLOv10）

本文旨在介绍XML格式转换为TXT格式的方法与步骤，为YOLO系列模型的用户提供实用的数据预处理工具。文章将详细阐述转换的背景原因、实现过程以及在实际操作中需注意的问题，期望能够帮助读者更高效地处理数据，进而在目标检测的道路上迈出更坚实的一步。

2024-09-09 00:30:35 1010

原创 YOLO系列目标检测 txt格式转xml格式（YOLOv5 YOLOv6 YOLOv7 YOLOv8 YOLOv9 YOLOv10）

在计算机视觉领域中，数据标注是训练准确高效深度学习模型的关键一环。随着目标检测技术的快速发展，YOLO（You Only Look Once）系列模型以其高速和高精度的特点，成为了众多研究者和开发者的首选。然而，在实际应用中，我们常常面临着标注数据格式不统一的问题，特别是在处理不同数据集或迁移学习场景中。YOLO 系列模型默认使用的文本（TXT）格式标注，尽管简洁高效，但在某些应用场景中，比如需要兼容Pascal VOC等其他工具或框架时，XML 格式的标注更为普遍和方便。

2024-09-09 00:23:45 661

原创 YOLO系列目标检测txt格式数据增强（YOLOv5 YOLOv6 YOLOv7 YOLOv8 YOLOv9 YOLOv10）

通过在训练过程中引入各种变化（如旋转、缩放、裁剪、颜色变换等），模型能够学习到更加通用的特征，从而提高对未见样本的分类和定位能力。简而言之，数据增强为YOLO系列模型提供了额外的、多样化的训练数据，帮助模型学习到更加鲁棒和通用的特征表达，进而提高模型的性能和在不同环境下的适用性。数据增强通过生成额外的训练样本，缓解了训练数据不足的问题，有助于提高模型的性能。通过更全面、多样化的训练样本，模型能够学习到更丰富的目标特征和背景信息，有助于提高检测的准确度和召回率。

2024-09-09 00:11:25 1470 2

原创视频抽帧：将视频逐帧抽取为图片用于标注

视频抽帧，将视频抽取为图片，用于数据集的制作

2024-09-09 00:00:12 435

原创将YOLO数据集按比例划分为测试集、训练集

yolo划分数据集

2024-09-08 23:56:36 365

原创 YOLO-seg的格式转化 JSON转TXT

json转txt，yolov8-seg

2024-09-08 23:49:05 471

原创 YOLOV9保姆级教程

yolov9环境搭建及运行（保姆级教程）

2024-02-23 12:16:50 32508 111

原创 Python

PYTHONPython基本语法元素计算机硬件编译程序与解释程序的区别选择动态语言从流程图到Python代码第一个程序输出个性微信签名打印欢迎购物求圆面积周长同切圆绘制五角星的绘制温度转换注释所有行使用变量打印数据类型回声程序存储MP3信息交换变量值计算BMI输入身高体重并计算BMIPython基本语法元素计算机硬件下列哪项属于计算机硬件？CPU硬盘显卡编译程序与解释程序的区别编译程序和解释程序的区别是（）编译程序能生成目标代码，而解释程序不能

2021-04-16 17:42:38 2486

Hyper-YOLO保姆级教程（私以为的YOLOv12）

Hyper-YOLO 是基于超图思想的下一代目标检测框架，通过在特征提取与语义表示中引入高阶关系推理，大幅度提升了检测精度与跨尺度、跨位置的特征交互效率。本文以“保姆级”手把手教程的形式，详细介绍了从环境搭建、代码下载到数据集准备与可视化训练的整个流程——包括如何利用 Anaconda 创建虚拟环境、安装 PyTorch (CPU/GPU 版本) 以及 ultralytics 环境；如何按照 YOLO 系列的常见格式制作训练数据；以及如何执行训练、验证和推理脚本等操作。并提供了完整的下载资源和示例文件，帮助初学者快速上手 Hyper-YOLO，以解决实际项目中的目标检测需求。无论是只具备 CPU 的本地电脑还是具备 GPU 的服务器，都能轻松跑通本教程，畅享 Hyper-YOLO 带来的全新检测体验。

2024-12-22

Hyper-YOLO保姆级教程（私以为的YOLOv12）

**摘要：** Hyper-YOLO 是基于超图思想的下一代目标检测框架，通过在特征提取与语义表示中引入高阶关系推理，大幅度提升了检测精度与跨尺度、跨位置的特征交互效率。本文以“保姆级”手把手教程的形式，详细介绍了从环境搭建、代码下载到数据集准备与可视化训练的整个流程——包括如何利用 Anaconda 创建虚拟环境、安装 PyTorch (CPU/GPU 版本) 以及 ultralytics 环境；如何按照 YOLO 系列的常见格式制作训练数据；以及如何执行训练、验证和推理脚本等操作。并提供了完整的下载资源和示例文件，帮助初学者快速上手 Hyper-YOLO，以解决实际项目中的目标检测需求。无论是只具备 CPU 的本地电脑还是具备 GPU 的服务器，都能轻松跑通本教程，畅享 Hyper-YOLO 带来的全新检测体验。如果可以，麻烦为文章点个赞，不胜感激。

2024-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人