YOLO是一种先进的实时的目标检测算法。训练过程包括数据准备、模型和框架选择、训练参数配置、训练过程、评估和调优以及部署和应用。
自2015年第一版本发布以来,YOLO至今已经经历了12个主要版本的迭代,每个版本都在提高检测精度、检测速度等方面进行改进,具体如下:
YOLO v1 | 通过分离边界框和使用单个CNN将每个检测图像的概率关联,主要解决RCNN系列速度问题 | 2015 |
YOLO v2 | 采用Darknet-19架构、引入Batch Normalization和Anchor boxes、提供多尺度训练,推理速度更快、准确度提升 | 2016 |
YOLO v3 | 采用Darknet-53架构、引入多尺度预测、使用逻辑回归损失函数来预测边界框,速度和准确率提升 | 2018 |
YOLO v4 | 采用CSPDarknet53,加入SPP与CSP、使用Mosaic数据增强、DropBlock正则化策略等技术,精度提升、计算资源减少 | 2020 |
YOLO v5 | 支持分割、SPFF提速,引入新的训练策略和数据增强方法,适用于部署在嵌入式芯片上,速度提升 | 2020 |
YOLO v6 | 结构重参数化提速EfficientRep、优化Backbone与Neck等部分,工业型改进 | 2022 |
YOLO v7 | 基于YOLO v5进行改进,高效聚合网络、RepConv、辅助头检测、采用swish激活函数 | 2022 |
YOLO v8 | 多尺度预测、自适应调整锚框、新的骨干网络、新的Ancher-Free检测头和新的损失函数,可进行检测、分割、姿态估计、跟踪和分类,全新SOTA模型 | 2023 |
YOLO v9 | 引入PGI和GELAN,轻量、快速、准确 | 2024 |
YOLO v10 | 无NMS训练的一致双重分配 | 2024 |
YOLO v11 | 采用全新Transformer架构、支持多模态输入 | 2024 |
YOLO v12 | 引入区域注意力机制、残差高效层聚合网络(R-ELAN) | 2025 |