YOLO综述:从YOLOV1到YOLOV8
- ABSTRACT
- 1 Introduction
- 2 YOLO Applications Across Diverse Fields
- 3 Object Detection Metrics and Non-Maximum Suppression (NMS)
- 4 YOLO: You Only Look Once
- 5 YOLOv2: Better, Faster, and Stronger
- 6 YOLOv3
- 7 Backbone, Neck, and Head
- 8 YOLOv4
- 9 YOLOv5
- 10 Scaled-YOLOv4
- 11 YOLOR
- 12 YOLOX
- 13 YOLOv6
- 14 YOLOv7
- 15 DAMO-YOLO
- 16 YOLOv8
- 17 PP-YOLO, PP-YOLOv2, and PP-YOLOE
- 18 Discussion
- 19 The future of YOLO
- 20 Acknowledgments
- References
ABSTRACT
YOLO 已成为机器人、无人驾驶汽车和视频监控应用的中央实时目标检测系统。我们对 YOLO 的演变进行了全面分析,检查了从原始 YOLO 到 YOLOv8 的每次迭代中的创新和贡献。我们首先描述标准指标和后处理;然后,我们讨论了每个模型的网络架构和训练技巧的主要变化。最后,我们总结了 YOLO 发展的重要经验教训,并展望了其未来,强调了增强实时目标检测系统的潜在研究方向。
1 Introduction
实时目标检测已成为众多应用中的关键组成部分,涵盖自动驾驶汽车、机器人、视频监控和增强现实等各个领域。在众多目标检测算法中,YOLO (You Only Look Once) 框架以其速度和准确性的卓越平衡而脱颖而出,能够快速可靠地识别图像中的目标。自成立以来,YOLO 家族经历了多次迭代,每个迭代都建立在以前的版本之上,以解决限制并提高性能(见图 1)。本文旨在全面回顾 YOLO 框架的发展,从最初的 YOLOv1 到最新的 YOLOv8,阐明每个版本的关键创新、差异和改进。本文首先探讨了原始 YOLO 模型的基本概念和架构,这为 YOLO 家族的后续发展奠定了基础。在此之后,我们深入研究了从 YOLOv2 到 YOLOv8 的每个版本中引入的改进和增强功能。这些改进包括网络设计、损失函数修改、锚框自适应和输