YOLOv6算法新鲜出炉--训练自己数据集过程

本文介绍了YOLOv6目标检测框架,对比YOLOv5在精度和速度上的优势,并提供了环境搭建、数据集制作、模型训练的详细步骤。通过实测,显示YOLOv6在泛化能力上优于YOLOv5。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


前言

目标检测数据集+分类数据集大全:

https://blog.youkuaiyun.com/DeepLearning_/article/details/127276492?spm=1001.2014.3001.5502
----------------------------------------------------------------------------------分割线------------------------------------------------------------------------------------------

YOLOv6算法背景:YOLOv6 是美团视觉智能部研发的一款目标检测框架,致力于工业应用。本框架同时专注于检测的精度和推理效率,在工业界常用的尺寸模型中:YOLOv6-nano 在 COCO 上精度可达 35.0% AP,在 T4 上推理速度可达 1242 FPS;YOLOv6-s 在 COCO 上精度可达 43.1% AP,在 T4 上推理速度可达 520 FPS。
评估指标如下;
在这里插入图片描述

官方公众哈介绍说 YOLOv6算法精度与速度远超 YOLOv5 和 YOLOX 的新框架,是真是假,还待自己跑跑测评一下,下面将介绍如何使用YOLOv6算法训练自己的数据集。
源码链接:https://github.com/meituan/YOLOv6

一、环境搭建

本人搭建的环境:Pytorch1.8.1 ,torchvision0.9.1, python3.8.1 cuda11.1 ,显卡是2080TI,系统为ubuntu18.04

代码下载后的结构如下图:
在这里插入图片描述
安装requirements.txt中的安装包,可以使用清华源快速安装,安装命令:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

如果出现个别安装不上的,建议单独通过pip install xxx来安装,requirements.txt内容如下:
在这里插入图片描述
博主在安装pycocotools出现找不到的情况,然后就直接使用pip install pycocotools来安装,只是安装过程较慢,需要等待。如果您是windows系统下安装pycocotools,好像麻烦点,需要依赖其他,不过都有博客介绍。

二、数据集制作

1.数据标注格式为yolo格式,跟yolov5使用的数据格式一模一样

2.data文件夹下仿照coco.yaml新建一个自己的.yaml文件

博主训练的是电单车、人两类目标的数据集,新建的yaml命名为:person_ebike.yaml
.yaml中的内容,包含训练集、验证集图片存放的文件夹的路径、类别数、类别名字。

值得注意的是文件夹路径最后不要带“/”,否则训练会报错,博主遇到坑,因为yolov5算法yaml文件中的图片路径最后是可以带“/”。
如正确的yaml,自建的yaml文件中只保留train:和val:就可以,那个test和anno_path删除。
在这里插入图片描述
路径结尾带有“/”,错误的yaml
在这里插入图片描述

配置好自己训练数据集对应的yaml文件后,就可以开始训练了,博主使用的是yolov6s.pt作为预训练模型。无需改其他文件,很简单。无非在train.py中设置epoch、batchsize、输入图片大小等。

三、模型训练

在YOLOv6文件夹下执行命令开始单卡训练:

python tools/train.py --batch 32 --conf configs/yolov6s_finetune.py --data data/person_ebike.yaml --device 0
![在这里插入图片描述](https://img-blog.csdnimg.cn/e448eeecac734aabaec25a92e6c5f1d9.jpeg#pic_center)

训练过程如下图所示:
在这里插入图片描述

YOLOv6与YOLOv5效果测试对比

分别用电梯内电单车+人形数据集训练两种算法的模型,模型迭代200次。
YOLOv5模型实际测试效果如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
yolov6s模型测试效果
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、总结

从测试效果来看,yolov6的泛化能力要比yolov5强,虽然,得分稍微比yolov5低点儿,实际工程应用,个人觉得yolov6更好,期待后面部署

### 使用YOLOv8实现PCB缺陷检测 #### 安装依赖环境 为了顺利运行YOLOv8模型,需先搭建好深度学习开发环境。这通常涉及Anaconda、CUDA以及YOLOv8本身的安装。 - **Anaconda安装** Anaconda是一个开源的数据科学平台,提供了Python包管理和环境管理功能。通过Anaconda可以方便地创建独立的虚拟环境来隔离不同项目的依赖关系[^1]。 - **CUDA安装** CUDA是NVIDIA推出的并行计算架构,允许开发者利用GPU加速应用程序执行速度。对于需要大量矩阵运算的任务如图像识别来说非常重要。确保所使用的计算机配备有支持CUDA技术的显卡,并按照官方指南完成驱动程序和工具包设置。 - **YOLOv8安装** 当上述准备工作完成后,则可着手于YOLOv8框架本身及其相关库文件的部署工作。一般情况下会推荐采用pip命令直接从PyPI仓库获取最新版本软件包来进行快速简便地安装操作。 ```bash pip install ultralytics ``` #### 数据准备与预处理 针对特定应用场景——即印刷电路板(Printed Circuit Board, PCB)上的瑕疵定位问题而言,高质量标注过的样本图片不可或缺。可以从公开资源处下载现成可用的数据集,比如由ObjectDetectionDT提供的专门面向此类任务而设计制作好的集合;当然也可以自行采集实物照片再经人工标记形成自定义版素材库用于后续实验研究目的[^3]。 一旦获得原始影像资料之后,便要对其进行必要的前处理步骤以适配神经网络输入格式需求: - 调整分辨率大小至固定尺寸; - 归一化像素强度分布范围; - 增广变换增强泛化能力等。 这些措施有助于提高最终输出效果质量的同时还能加快收敛速率减少过拟合风险发生几率。 #### 训练过程概述 借助Ultralytics团队维护下的API接口能够轻松调用内置优化器自动调整参数直至达到预期性能指标为止。具体流程如下所示: - 加载预训练权重初始化各层节点连接权值; - 设定超参组合方案探索最佳配置选项; - 执行多轮迭代更新梯度方向指导模型逐步逼近全局最优解位置; - 定期保存中间产物以便随时恢复断点继续未竟之事。 期间可通过TensorBoard可视化监控面板实时跟踪损失函数变化趋势曲线图以及其他辅助评估统计量数值波动情况从而及时发现问题所在之处进而采取相应对策加以改进完善整个体系结构设计思路。 #### 验证测试环节 当经过充分打磨后的成品出炉以后自然少不了对其实际效能进行全面细致入微地考察验证一番。选取一部分之前未曾参与过任何一轮次的学习过程的新鲜实例作为检验对象群体,依据预测得分高低顺序排列展示出来供人们直观感受算法优劣差异程度究竟几何。 此外还可以参照混淆矩阵Confusion Matrix这一经典评价标准进一步量化分析各类别之间误判率水平状况,以此为依据不断反哺上游工序促使整体链条更加紧密高效运作起来达成良性循环发展态势。 #### 实际应用案例分享 根据已有文献报道,在CVPR 2023会议上提出的BiFormer方法被应用于基于YOLOv5的PCB缺陷检测项目当中取得了显著成效。该创新性成果主要体现在引入了一种双级路由注意力机制(Bi-Level Routing Attention),有效提升了特征提取阶段的空间感知能力和语义理解层次,使得即便是面对复杂背景干扰条件下依然保持较高的召回率Recall与精确度Precision平衡状态[^2]。 尽管这里提到的是YOLOv5版本的应用实践范例,但对于同属目标检测家族成员之一的YOLOv8同样具有借鉴意义价值所在的地方值得深入探讨挖掘潜在可能性空间边界拓展更多元化的解决方案路径选择。
评论 26
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

onnx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值