yolo v2:yolo 9000,检测目标种类超过9000


1.Batch Normalization
在每个卷积层后都添加了BN层,不再使用dropout
2.高分辨率分类器
从224*224——>448*448,更大的输入尺寸
3.使用anchor box
4.anchor聚类,K-means算法
5.目标边界框预测的改进,每个anchor只负责预测网格区域内的目标
6.更底层的信息,低层特征与高层特征融合
7.多尺度训练方法:416*416 480*480 每迭代10轮,就随机选择一个尺寸
BackBone:DarkNet-19 (19个卷积层)
YOLOv3:An Incremental Improvement(一种递增的提高)

yolo v3模型

在三个预测特征层上进行预测的
每个预测特征层会使用三种尺度

这个1是confidence score
在预测特征层1上预测大目标 在3上预测小目标
yolov3 目标边界框的预测

正样本选取:只选与bounding box重合度最大的
不是最大的,但是超过阈值的,就丢弃

yolov3 spp
Mosaic图像增强
之前的图像增强方法:随机裁剪 随机水平翻转 色度饱和度


在yolo v3第一个预测特征层之前插入了spp结构
这篇博客介绍了YOLOv2和YOLOv3目标检测模型的改进点。YOLOv2引入了BatchNormalization,增大了输入尺寸,使用AnchorBox并改进了边界框预测。YOLOv3则在三个尺度上预测,并采用了SPP结构和Mosaic图像增强技术,提升了检测性能。此外,还详细讨论了正样本选取策略和多尺度训练方法。
744

被折叠的 条评论
为什么被折叠?



