YOLOv3学习

最新推荐文章于 2024-10-06 20:45:31 发布

原创最新推荐文章于 2024-10-06 20:45:31 发布 · 906 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#YOLOv3

目标检测专栏收录该内容

6 篇文章

订阅专栏

YOLOv3在YOLOv2基础上进行了改进，采用三种不同尺度预测边界框，提高了小目标检测性能。它使用logistic回归预测objectness分数，并且在IOU=0.5时表现出色。Darknet-53作为其基础网络，在保证高性能的同时减少了浮点运算，运行速度优于ResNet。

网址：YOLOv3: An Incremental Improvement https://arxiv.org/abs/1804.02767

在YOLOv2的基础上进行了一些小的设计改动
实现效果：
YOLOv3使用logistic回归来对每一个bb预测一个objectness分数。其中，如果一个bb的先验与金标准重叠的量最多，那么就认为该bb的objectness score为1。如果一些bb与金标准重合的量大于某些阈值，但不是最好的，我们会忽略这个bb。对于每一个金标准对象，我们只赋予一个bb先验。如果一个bb先验没有赋予一个金标准对象，那么对于坐标或者类别的预测将不会有损失，只有objectness
YOLOv3以三种不同的尺度来预测boxes，使用的网络结构仍然是相同的

每个网络都用相同的设置进行训练，并在256× 256分辨率的图片上，单一粒度精度下进行测试。运行时间是在Titan X上以256×256测量的。因此，Darknet-53与最先进的分类器性能相当，但浮点运算更少，速度更快。Darknet-53比ResNet-101更好，速度快1.5×。Darknet-53也有类似的性能resnet-152和速度快2×。
Darknet-53还实现了每秒最高的浮点运算。这意味着网络结构更好地利用了gpu，使其评估更有效率，从而更快。这主要是因为ResNets的图层太多，效率不高
当我们查看IOU= 0.5(或图表中的AP 50)时旧的mAP检测指标时，YOLOv3非常强大。它几乎与RetinaNet相当，远高于SSD变体。这表明YOLOv3是一种非常强大的检测器，它擅长为对象生成合适的box。然而，随着IOU阈值的增加，性能显著下降，这表明YOLOv3很难使box与对象完全对齐
同时，随着多尺度box的引入，YOLOv3对于小对象的检测效果也提高了，但是对于中和大尺寸的对象的性能就较差了