论文简介:
YOLO是作者针对R-CNN系列等的Two-stage的目标检测算法的时间性能较低,训练、预测Pipeline分散复杂等的缺点,提出的一种更接近端到端的目标检测算法。其具有更加统一、清晰的结构,具有较高的时间性能,可以达到实时检测,但具有比Faster R-CNN较低的准确性(MAP)。
一、YOLO V1 简介
在R-CNN系列等的Two-stage的目标检测算法中,基本都遵循需要进行Region proposal的生成,再进行proposal的特征提取,proposal的分类,Bounding boxes位置回归等复杂的分步计算思路。而YOLO将目标检测问题当做一个回归问题进行求解,使用一个训练好的CNN网络,对输入图像进行一次前向传播计算,同时预测出图像中各个物体的位置及类别概率等信息,达到了一种更接近端到端的目标检测算法。
二、YOLO V1 inference
在给定一幅含有待检测目标的图像时,在YOLO实际进行推理、进行目标检测时,首先将图像resize到模型输入尺寸(448x448,因YOLO使用最后的全连接层进行预测、回归,全连接层尺寸数值确定,所以,前推后的输入尺寸确定),然后输入一个训练好的传统CNN网络(由若干卷积、池化、全连接层组成),在网络的最后一个全连接层,按照一定的规则将1维全连接层reshape到一个7x7x30的tensor,网络输出的这个7x7x30的tensor包含有网络预测到的测试图像中含