目标检测算法:从YOLO到TensorFlow训练实践
1. YOLO网络设计
YOLO(You Only Look Once)网络架构的灵感来源于用于图像分类的GoogLeNet。经过微调的适用于YOLO的GoogLeNet由24个卷积层和最大池化层组成,随后是两个全连接层。最终一层会生成维度为7×7×30的输出张量。
2. YOLO的局限性
尽管YOLO是最快的目标检测算法之一,但它存在一些局限性:
- 难以处理成群的小目标,例如鸟群。
- 在一个单元格网格内只能预测一类目标。
- 如果目标的宽高比在训练集中未出现过,预测效果不佳。
- 与一些最先进的算法(如Faster R - CNN)相比,其准确率较低。
3. YOLO9000(YOLOv2)
YOLOv2是YOLO的改进版本,它在检测准确率和速度方面都有所提升。它经过训练可以检测超过9000种目标类别,因此被命名为YOLO9000。
YOLOv2为克服YOLO的一些局限性(尤其是精度和召回率)而设计,并且能够检测具有未见过宽高比的目标。以下是YOLOv2为实现更好、更快、更强的结果所做的改进:
- 批量归一化 :在YOLO的所有卷积层上添加了批量归一化。批量归一化有助于正则化模型,使用它使YOLOv2的平均精度均值(mAP)提高了超过2%。
- 高分辨率分类器 :对YOLOv2进行微调,使其从更高分辨率的输入图像中学习。在448×448分辨率下,网络输出的mAP提高了4%。
- 带锚框的卷积
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



