YOLOv1阅读重点
YOLO v1原论文地址 https://arxiv.org/pdf/1506.02640.pdf
Introduction
YOLOv1之前的目标检测算法基本都是通过重用分类器实现目标检测的,但是YOLOv1把目标检测看作一个单一的回归问题,从空间上分割边界框、预测有关的类别概率。
The YOLO Detection System
YOLOv1的检测流程如上图所示,先输入一张图片,(1)然后将该图片裁剪成448*448,(2)再在这张图片运行单个卷积神经网络,(3)最后再根据求得的模型置信度对检测结果进行阈值处理。
The Model
模型如上图所示,把裁剪后的图片划分成S*S的网格,每个网格预测B个边界框以及每个边界框的置信度,然后每个网格还得预测C个类别概率,所以最后预测到的目标标签是一个S * S * (B * 5 + C)的tensor,这里的5就是对应下图这5个数据(x,y:边界框中心点坐标