【YOLO 系列】YOLO详细解读（1）：YOLO系列简介

原创已于 2024-10-16 11:15:32 修改 · 1.1k 阅读

·

24

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2024-10-16 11:08:01 首次发布

YOLO系列专栏收录该内容

1 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

YOLO 系列算法详细解读

一、基本思想

YOLO（You Only Look Once）是一种高效的目标检测算法，其核心思想是将目标检测视为一个回归问题，直接预测边界框和类别概率，而不依赖传统的区域建议方法。

二、YOLO的版本更新与创新点

1. YOLOv1

作者: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
发表年份: 2016
论文标题: [[You Only Look Once: Unified, Real-Time Object Detection]](E:\研究生项目\0. 论文：Deep-Learning-Papers-Reading-Roadmap（学习路径）\6. Image Deep Vision(VGG RENET Yolo ViT)\YOLO Unified, Real-Time Object Detection.pdf)
论文地址: https://arxiv.org/abs/1506.02640
代码仓库: https://github.com/pjreddie/darknet
创新点:
- 首次提出将目标检测任务看作回归问题，用单一的卷积神经网络一次性预测多个目标的类别和边界框。
- 相较于传统方法（如R-CNN），YOLO大幅提高了检测速度。
【YOLO 系列】YOLO详细解读（1）：YOLOv1论文翻译+学习心得

2. YOLOv2

作者: Joseph Redmon, Ali Farhadi
发表年份: 2017
论文标题: YOLO9000: Better, Faster, Stronger
论文地址: https://ieeexplore.ieee.org/document/8100173
代码仓库: https://github.com/pjreddie/darknet
创新点:
- 引入了 锚框（Anchor Boxes），提升了定位精度。
- 采用 Batch Normalization，加速收敛。
- 支持 多尺度训练，增强了模型对不同分辨率图像的适应性。
- 在数据集COCO、VOC2007上YOLO9000可以检测9000类物体，结合了分类和检测数据。

3. YOLOv3

作者: Joseph Redmon, Ali Farhadi
发表年份: 2018
论文标题: YOLOv3: An Incremental Improvement
论文地址: https://arxiv.org/abs/1804.02767
代码仓库: https://github.com/pjreddie/darknet
创新点:
- 引入了 特征金字塔（FPN），支持多尺度目标检测。
- 使用 Logistic 回归 代替 Softmax，用于多标签分类任务。
- 采用了 Darknet-53，深度更大且性能更优的网络结构。
- 支持对不同尺寸目标的更好检测，特别是对小目标。

4. YOLOv4

作者: Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
发表年份: 2020
论文标题: YOLOv4: Optimal Speed and Accuracy of Object Detection
论文地址: https://arxiv.org/abs/2004.10934
代码仓库: https://github.com/AlexeyAB/darknet
创新点:
- 引入 CSPDarknet53 作为主干网络，优化了计算性能和精度。
- 使用 Mosaic 数据增强 和 DropBlock 正则化 技术，提升了模型的泛化能力。
- 加入了 CIoU 损失，创新点了边界框回归的精度。
- 提高了推理速度，适合在实时场景中使用。

5. YOLOv5

作者: Ultralytics (开源社区)
发表年份: 2020
论文地址: 无正式论文，属于社区维护版本
代码仓库: https://github.com/ultralytics/yolov5
创新点:
- 使用PyTorch框架实现，较之前的YOLO版本（基于Darknet）更易于扩展和维护。
- 提供了更方便的API、训练脚本和丰富的预训练模型。
- 引入了 AutoAnchor、 Hyperparameter Evolution 和其他训练技巧，提高了模型的性能。
- 性能优异且非常易于部署，支持多种平台。

6. YOLOv6

作者: Meituan（美团）
发表年份: 2022
论文地址: https://arxiv.org/abs/2209.02976
代码仓库: https://github.com/meituan/YOLOv6
创新点:
- 引入了更加轻量化的架构 RepVGG，适合移动设备和嵌入式设备。
- 增强了 NMS（非极大值抑制） 的效率，使其能够更快地处理大规模数据。

7. YOLOv7

作者: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
发表年份: 2022
论文标题: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
论文地址: https://arxiv.org/abs/2207.02696
代码仓库: https://github.com/WongKinYiu/yolov7
创新点:
- 引入了更多的优化技巧，如 ELAN（Extended Linear Attention Networks），提高了特征提取能力。
- 实现了更好的速度-精度平衡，COCO数据集上达新的SOTA。
- 提供了轻量级和大规模的模型，适合不同的硬件设备和应用场景。

8. YOLOv8

作者: Ultralytics (开源社区)
发表年份: 2023
论文地址: 无正式论文
代码仓库: https://github.com/ultralytics/ultralytics
创新点:
- 采用了更加灵活和模块化的架构，便于扩展和集成。
- 支持 自动优化超参数，进一步提升模型的精度。
- 内置了大量预训练模型和工具，提供更好的推理、训练、部署体验。

——持续更新，2024.10.16——

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

zomnlin 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。