ML-目标检测算法YOLO

最新推荐文章于 2025-05-15 11:10:33 发布

Guardian_Bud

最新推荐文章于 2025-05-15 11:10:33 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42683993/article/details/89058712

YOLO（You Only Look Once）是一种目标检测算法，通过网络输入整幅图像并直接预测边界框位置和类别。每个网格预测B个边界框，每个框包含坐标、置信度和类别信息。损失函数包括坐标误差、IOU误差和分类误差。YOLOv2引入了Batchnorm、预训练尺寸调整、更细网络划分、全卷积网络、新基础网络、anchor机制和残差层，提高了检测性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目标检测算法——Yolo

YOLO 的核心思想就是利用整张图作为网络的输入，直接在输出层回归 bounding box（边界框）的位置及其所属的类别。将一幅图像分成 SxS 个网格（grid cell），如果某个 object 的中心落在这个网格中，则这个网格就负责预测这个 object，

输出特征向量形式
- 每个网格要预测 B 个 bounding box，每个 bounding box 除了要回归自身的位置之外，还要附带预测一个 confidence 值。这个 confidence 代表了所预测的 box 中含有 object 的置信度和这个 box 预测的有多准这两重信息，其值是这样计算的：
  
  其中如果有 object 落在一个 grid cell 里，第一项取 1，否则取 0。第二项是预测的 bounding box 和实际的 groundtruth 之间的 IoU 值。
- 每一个栅格还要预测C个 conditional class probability（条件类别概率）：Pr(Classi|Object)。即在一个栅格包含一个Object的前提下，它属于某个类的概率。我们只为每个栅格预测一组（C个）类概率，而不考虑框B的数量。
- 每个 bounding box 要预测 (x, y, w, h) 和 confidence 共5个值，每个网格还要预测一个类别信息，记为 C 类。则 SxS个网格，每个网格要预测 B 个 bounding box 还要预测 C 个 categories。输出就是 S x S x (5*B+C) 的一个 tensor。（条件类别概率）conditional class probability信息是针对每个网格的。（置信度）confidence信息是针对每个bounding box的。
- 在测试阶段，将每

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。