YOLO后处理

无用技术研究所

于 2018-10-23 13:13:00 发布

阅读量5.2k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44546360/article/details/89877157

版权

本文详细介绍了YOLO（You Only Look Once）算法中的后处理步骤，包括解码和非极大值抑制（NMS）。解码过程涉及从网络输出的tensor解析出边界框的位置和类别信息，而NMS用于筛选最佳识别框，消除重复检测。通过理解这些步骤，可以更好地了解YOLO如何处理目标检测任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首发于个人博客

理论分析

system.png

YOLO从v2版本开始重新启用anchor box，YOLOv2网络的网络输出为尺寸为[b,125,13,13]的tensor，要将这个Tensor变为最终的输出结果，还需要以下的处理：

解码：从Tensor中解析出所有框的位置信息和类别信息
NMS：筛选最能表现物品的识别框

解码过程

解码之前，需要明确的是每个候选框需要5+class_num个数据，分别是相对位置x,y，相对宽度w,h，置信度c和class_num个分类结果，YOLOv2-voc中class_num=20，即每个格点对应5个候选框，每个候选框有5+20=25个参数，这就是为什么输出Tensor的最后一维为5*（20+5）=125。

tensor.png

上图为一个框所需要的所有数据构成，假设这个框是位于格点X,Y的，对应的anchor box大小为W,H，位置相关参数的处理方法如下所示，其中，分别是输出Tensor在长宽上的值，这里；分别为原图片的长和宽：

置信度和类别信息处理方法如下所示：

当格点置信度大于某个阈值时，认为该格点有物体，物体类别为class_id对应的类别

NMS

NMS为非最大值抑制，用在YOLO系统中的含义指从多个候选框标记同一个物品时，从中选择最合适的候选框。其基本思维很简单：使用置信度最高的候选框标记

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。