YOLOV1和YOLOV2

早睡335

于 2025-03-12 16:40:41 发布

阅读量181

点赞数 6

文章标签：课程设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2402_85245931/article/details/146208997

版权

YOLO-V1

核心特点：one-stage方法，将检测问题转化为回归问题，能实时检测视频。

核心思想：把输入图像划分为S×S网格，预测边界框、置信度和类别概率。

网络架构：基于GoogLeNet修改，含20层，最终输出7×7×30张量。

性能与局限：速度快但存在每个Cell只预测一个类别、小物体检测效果差等问题。

核心思想

首先将输入图像划分为S×S的网格，若物体的中心落在某个网格中，该网格就负责检测这个物体。

2. 每个网格会预测多个边界框及其置信度，置信度表示该框内存在物体的可能性以及框的准确性。

3. 同时，每个网格还会预测一个类别概率图，表示该网格所检测到的物体属于不同类别的概率。

4. 最后，根据边界框、置信度和类别概率，筛选出最终的检测结果，也就是用不同颜色框标记出图像中的各个物体。

网络架构

输入部分中间处理输出部分张量解释

NMS的作用是在目标检测中，当一个目标被多个边界框检测到时，保留置信度最高的边界框，抑制其他重叠的边界框。

YOLOV2

计算公式

感受野

改进策略：舍弃Dropout，全卷积层添加Batch Normalization，使网络输入归一化，mAP提升2%。训练时增加448×448分辨率微调，使用高分辨率分类器，mAP提升约4%。

◦ 创新机制：Directed Location Prediction改进定位计算，避免直接用偏移量导致的收敛问题；融合之前特征捕捉小目标；多尺度训练，改变输入图像大小（320×320 - 608×608）增强模型适应性。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。