You look only once（YOLO）通俗篇

最新推荐文章于 2025-05-21 16:00:45 发布

原创

最新推荐文章于 2025-05-21 16:00:45 发布 · 2.7k 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#YOLO #real time detector

本文深入探讨了YOLO目标检测框架，介绍了其创新的回归方法、高速处理能力、全局信息利用及良好适应性。YOLO将检测过程简化为单一神经网络，通过端到端训练实现高精度与实时性。文章详细解析了YOLO的工作原理，包括输入图片的网格划分、bbox预测及类别的确定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我今天真的爆发了，把十来天看的两篇论文又复习了一遍，顺便也就都写了博客

说起YOLO，很早前就听过它的大名，快速的detection方案。但是比起YOLO，我很喜欢称之为YOU ONLY LOOK ONCE（一见倾心），这个名字真的是太有诗意了，hhh，笑出猪叫声。好啦，感觉每次说废话占去我博客十分之一的字有了，下面言归正传。

一、前言

首先要对比一下YOLO与之前常见的detection之间的最大差别，之前的方法都是把分类器稍加修改用来做detect，但是呢，在YOLO中提出了一种新的思路，使用回归来做detection，在空间上分离计算出bbox以及相应的probability，并且只需要一次计算就可以算出最后的结果。与之前诸多方法相比，YOLO最大的进步就是真正意义上实现了detection的实时效果。普通的YOLO可以达到45帧每秒的速度，而一种fast YOLO的改进型可以达到155帧每秒的速度。

总结来说，YOLO对比之前的网络有着以下的三点突破：

1、YOLO的速度很快，因为将detection作为一个regression的问题之后，它就不再需要大量的计算过程了，在不使用GPU的情况下就可以达到45帧每秒的处理速度。

2、YOLO采取整个图片作为输入，它获取的是全局的信息，因而能够做出更好的预测，不像一些基于滑窗或者是建议框的方法，YOLO能够提取到更加高级的语义信息。

3、YOLO具有更强的迁移性和适应性，当它被应用于一些陌生的场景时。

二、细说YOLO

作者在文中，将整个复杂的detection过程融合到一个简单的神经网络中去了，这是一个端到端的训练过程，在保持高速的同时保持着很高的正确率。

下面来看看YOLO是如何进行工作的，YOLO将整个输入的图片分为s*s个格子，如果一个待检测物体的中心落在这个格子中，那么这个格子就负责检测这个物体。

每个格子会预测B个bbox以及相应的confidence。这个confidence代表了模型对于该格子中包含物体的信赖度。作者使用这样一个公式来计算confidence：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

与贰 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。