YOLOV3预选框验证

原创已于 2022-08-07 15:43:47 修改 · 5k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉 #深度学习 #目标检测

于 2021-12-13 15:02:54 首次发布

嵌入式系统同时被 2 个专栏收录

354 篇文章

订阅专栏

人工智能

155 篇文章

订阅专栏

本文详细介绍了YOLOV3的预选框验证过程，每个输入图像对应10647个预测框，通过IOU最大化原则确定负责预测的对象。每个网格有3个先验框，最终选择与实际边框IOU最大的先验框进行预测。YOLOV3的预选框尺寸基于anchor框组合，实际推理时，预测框是经过anchor框微调得到的。此外，探讨了YOLOV3-tiny模型与大模型的预选框数量和后处理逻辑差异。

部署运行你感兴趣的模型镜像

对于一个输入图像，比如416*416*3，相应的会输出 13*13*3 + 26*26*3 + 52*52*3 = 10647 个预测框。我们希望这些预测框的信息能够尽量准确的反应出哪些位置存在对象，是哪种对象，其边框位置在哪里。

在设置标签y（10647个预测框 * (4+1+类别数) 张量）的时候，YOLO的设计思路是，对于输入图像中的每个对象，该对象实际边框（groud truth）的中心落在哪个网格，就由该网格负责预测该对象。不过，由于设计了3种不同大小的尺度，每个网格又有3个先验框，所以对于一个对象中心点，可以对应9个先验框。但最终只选择与实际边框IOU最大的那个先验框负责预测该对象（该先验框的置信度=1），所有其它先验框都不负责预测该对象（置信度=0）。同时，该先验框所在的输出向量中，边框位置设置为对象实际边框，以及该对象类型设置为1。

YOLOV3预选框定义如下，来源于darknet网络模型定义文件yolov3.cfg，anchors框的组合方式为宽X高。