YOLOv4论文笔记详解

最新推荐文章于 2025-03-29 13:58:04 发布

这题要怎么做

最新推荐文章于 2025-03-29 13:58:04 发布

阅读量1.3w

点赞数 14

分类专栏：互联网相关深度学习 pytorch 文章标签：机器学习目标检测深度学习 tensorflow pytorch

本文链接：https://blog.youkuaiyun.com/lifei1229/article/details/105848879

版权

本文详细介绍了YOLOv4论文，该模型在目标检测领域实现了速度与精度的最佳平衡。作者引入了多种技术，如Weighted-Residual-Connections、Cross-Stage-Partial-connections、Mish激活等，以及Mosaic数据增强和CmBN等技巧，实现在MS COCO数据集上达到43.5%的AP，并在Tesla V100上实现65FPS的速度。此外，文章还探讨了Bag of Freebies和Bag of Specials的训练策略，以及各种实验结果和影响因素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文作者不再是YOLO 之父 Joseph Redmon，而是来自俄罗斯的 Alexey Bochkovskiy和两位台湾开发者Chien-Yao Wang、Hong-Yuan Mark Liao。

论文地址：YOLOv4: Optimal Speed and Accuracy of Object Detection （Optimal ：最优的）

Github上已经有了一些代码：

YOLOv4 的 TensorFlow 2.0 实现：https://github.com/xiao9616/yolo4_tensorflow2
YOLOv4 的 TensorFlow 实现（持续更新）：https://github.com/rrddcc/YOLOv4_tensorflow
YOLOv4 的 TensorFlow 实现：https://github.com/klauspa/Yolov4-tensorflow
YOLOv4 的 PyTorch 实现：https://github.com/GZQ0723/YoloV4
YOLOv4（TensorFlow后端）的 Keras 实现：https://github.com/Ma-Dan/keras-yolo4
YOLOv4 的 PyTorch 实现：https://github.com/Tianxiaomo/pytorch-YOLOv4

下面简单介绍下论文的方法，遇到新的点会说明下。

摘要

原文翻译：

有大量的技巧可以提高卷积神经网络（CNN）的精度。需要在大数据集下对这种技巧的组合进行实际测试，并对结果进行理论论证要求。某些技巧仅在某些模型上使用和专门针对某些问题，或只针对小规模的数据集；而一些技巧，如批处理归一化、残差连接等，适用于大多数的模型、任务和数据集。

我们假设这种通用的技巧包括：Weighted-Residual-Connection（WRC）、Cross-Stage-Partial-connections (CSP)、跨小型批量连接(CSP)、Cross mini-Batch Normalization（CmBN），Self-adversarial-trainin（SAT）和Mish-activation。

我们在本文中使用这些新的技巧：WRC、CSP、CmBN、SAT，Mish-activation，Mosaic data augmentation、CmBN、DropBlock正则化和CIoU损失，以及组合技巧，以达到最好的效果。在MS COCO数据集中的AP43.5%（65.7% AP50），在实际应用中，Tesla V100上速度可达到65FPS。

摘要说明了：摘要一下子出现很多词汇，这些都是YOLOv4引进的各种技巧（论文涉及的技巧达20多个），正文会有说明。这些技巧一般来自顶会论文，有的技巧是在过拟合数据，而有些技巧则是真的适合通用模型。同时作者也做了大量大量的实验，可以说YOLOv4是一篇效果显著的实验报告了，也可以看作各种技巧的综述吧，因为论文引用量达到102篇。

同时论文也说明了最后选用了哪些技巧。

Tips:技巧类的论文还有李沐老师的两篇论文，分别是