网址:YOLOv3: An Incremental Improvement https://arxiv.org/abs/1804.02767
- 在YOLOv2的基础上进行了一些小的设计改动
实现效果:
- YOLOv3使用logistic回归来对每一个bb预测一个objectness分数。其中,如果一个bb的先验与金标准重叠的量最多,那么就认为该bb的objectness score为1。如果一些bb与金标准重合的量大于某些阈值,但不是最好的,我们会忽略这个bb。对于每一个金标准对象,我们只赋予一个bb先验。如果一个bb先验没有赋予一个金标准对象,那么对于坐标或者类别的预测将不会有损失,只有objectness
- YOLOv3以三种不同的尺度来预测boxes,使用的网络结构仍然是相同的
每个网络都用相同的设置进行训练,并在256× 256分辨率的图片上,单一粒度精度下进行测试。运行时间是在Titan X上以256×256测量的。因此,Darknet-53与最先进的分类器性能相当,但浮点运算更少,速度更快。Darknet-53比ResNet-101更好,速度快1.5×。Darknet-53也有类似的性能resnet-152和速度快2×。
Darknet-53还实现了每秒最高的浮点运算。这意味着网络结构更好地利用了gpu,使其评估更有效率,从而更快。这主要是因为ResNets的图层太多,效率不高
当我们查看IOU= 0.5(或图表中的AP 50)时旧的mAP检测指标时,YOLOv3非常强大。它几乎与RetinaNet相当,远高于SSD变体。这表明YOLOv3是一种非常强大的检测器,它擅长为对象生成合适的box。然而,随着IOU阈值的增加,性能显著下降,这表明YOLOv3很难使box与对象完全对齐
同时,随着多尺度box的引入,YOLOv3对于小对象的检测效果也提高了,但是对于中和大尺寸的对象的性能就较差了