文章目录
Absstract
本文为YOLO提供了一系列更新!它包含一堆小设计,可以使系统的性能得到更新;也包含一个新训练的、非常棒的神经网络,虽然比上一版更大一些,但精度也提高了。不用担心,虽然体量大了点,它的速度还是有保障的。在输入320×320的图片后,YOLOv3能在22毫秒内完成处理,并取得28.2mAP的成绩。它的精度和SSD相当,但速度要快上3倍。和旧版数据相比,v3版进步明显。在Titan X环境下,YOLOv3的检测精度为57.9AP50,用时51ms;而RetinaNet的精度只有57.5AP50,但却需要198ms,相当于YOLOv3的3.8倍。
1.引言
首先,我们会告诉你YOLOv3的处理是什么。然后我们会告诉你我们是怎么做的。我们还将告诉您一些我们尝试过但没有成功的事情。最后,我们将思考这一切意味着什么。
2.The Deal
YOLOv3的处理是这样的:
我们大多从别人那里得到好的想法。我们还训练了一个比其他分类器更好的新分类器网络。我们将带您从头开始浏览整个系统,以便您能够理解所有内容。

2.1.边界框预测(Bounding Box Prediction)
按照YOLO9000,我们的系统使用维度聚类作为定位框来预测边界框。网络预测每个边界框的4个坐标 tx、ty、tw、th 。如果单元格相对于图像左上角的偏移量为(cx,cy),且之前的边界框具有宽度和高度 pw,ph,则预测对应于:
bx = σ(tx) + cx
by = σ(ty) + c

YOLOv3论文详细介绍了其在目标检测领域的改进,包括边界框预测、分类预测、跨尺度预测等方面。通过使用新训练的神经网络,YOLOv3在保持高速的同时提升了精度。与前代相比,YOLOv3在速度和性能上都有显著提升,尤其是在Titan X环境下,YOLOv3的检测速度远超其他模型。文章还探讨了未能成功的尝试,如使用focal loss和不同IOU阈值等。
最低0.47元/天 解锁文章
3447

被折叠的 条评论
为什么被折叠?



