一、YOLO概述
- YOLO属于one-stage目标检测算法,使用一个神经网络直接将一整张图像输入神经网络,进而预测得到目标的类别和边界框。
- YOLO网络和GoogleNet网络结构类似,其中,YOLO用3×3和1×1的卷积替代了GoogleNet的inception module。
- YOLO具有检测速度快、不容易出现背景错误等优点;但也存在对小物体的检查效果不好等的缺点。
二、YOLOv2的改进
-
添加BN(Batch Normalization)层,对网络的每一层输入进行归一化
-
引入Anchor box
-
将分类网络(预训练模型)分辨率由224×224提高到448×448
-
通过K-means聚类方法进行边界框聚类
-
把浅层和深层特征层相连,更好地对小物体进行检测
-
在一定batches之后调整图像大小,实现多尺度地训练等
三、YOLOv3的改进
-
将softmax层替换成逻辑回归层,以实现多标签分类
-
在YOLOv2的基础上,把三个尺度进行融合,进一步提高对小物体的检测性能等
四、特征提取器
- YOLOv2提出了Darknet-19这一特征提取器(对应19个卷积层和5个max pooling层)
- YOLOv3提出了Dark net-53这一特征提取器(在Darknet-19的基础上扩充至53层)
- 主体都大量使用了3×3和1×1卷积核