- You Only Look Once: Unified, Real-Time Object Detection论文地址
- Paperwithcode在目标检测的排名
- Github参考代码,100k个star
该论文最新由Facebook AI发表于2016年5月,截止现在2024年10月,引用数是52854次
文章目录
论文核心内容(省流版阅读这里即可)
本章节介绍了YOLO(You Only Look Once)作为一种新的目标检测方法,并对其特点和优势进行了说明。下面逐步解析论文的核心内容:
1. 引言
- 传统方法:以前的目标检测方法通常是将分类器重新用于检测任务,即先训练一个分类器,然后将其用于检测。
2. YOLO 的新方法
- 回归问题:YOLO 将目标检测视为一个回归问题,直接从图像中预测出空间上分离的边界框(bounding boxes)及其相关的类别概率。
- 单一网络:使用单一的神经网络直接从整个图像中预测边界框和类别概率,而不是通过多阶段的检测流程。
- 下图展示了论文的核心思想:
3. 端到端优化
- 统一架构:由于整个检测流程是一个单一的网络,所以可以在检测性能上进行端到端的优化。
4. 速度优势
- 实时处理:YOLO 的基础模型可以实现实时处理,处理速度为每秒45帧(FPS)。
- 快速版本:更小的网络版本(Fast YOLO)处理速度高达每秒155帧,同时仍然能够达