【目标检测】YOLO v1算法

在这里插入图片描述
NMS的适用情况是什么?
答:多目标检测时用NMS。

YOLO网络结构:24个卷积层+2个全连接层
在这里插入图片描述

1.YOLO总体结构
去掉候选区这个步骤以后,YOLO的结构非常简单,就是单纯的卷积、池化最后两层全连接。单看网络结构的话,和普通的CNN分类网络几乎没有什么本质区别,最大的差异是最后输出层用线性激活函数,因为需要预测bounding box的位置(数值型),而不仅仅是对象概率。所以粗略来说,YOLO的整个结构就是输入图片经过神经网络的变换得到一个输出的张量,如下图所示:

在这里插入图片描述
因为只是一些常规的神经网络结构,所以,理解YOLO的设计的时候,重要的是理解输入和输出的映射关系

2.输入和输出的映射关系

在这里插入图片描述
3.输入
输入就是原始图像,唯一的要求是缩放到448448的大小。主要是因为YOLO的网络中,卷积层最后接了2层全连接层,全连接层要求固定大小的向量作为输入,所以倒推回去也就要求原始图像有固定的尺寸。YOLO设计的尺寸就是448448。

4.输出
输出是一个7730的张量(tensor)。

4.1. 7*7网格
根据YOLO的设计,输入图像被划分为77的网格(grid),输出张量中77就对应着输入图像的77网格。或者我们把77*30的张量看作49个30维的向量,也就是输入图像中的每个网格对应输出一个30维的向量。【输入图像左上角的网格对应到输出张量中左上角的向量。】要注意的是,并不是说仅仅网格内的信息被映射到一个30维向量。经过神经网络对输入图像信息的提取和变换,网格周边的信息也会被识别和整理,最后编码到那个30维向量中。

4.2. 30维向量
具体来看每个网格对应的30维向量中包含了哪些信息:

在这里插入图片描述
1)20个对象分类的概率
因为YOLO支持识别20种不同的对象(人、鸟、猫、汽车、椅子等),所以这里有20个值表示该网格位置存在任一种对象的概率。可以记为P(C_1|Object), …, P(C_i|Object),…P(C_20|Object) ,之所以写成条件概率,意思是如果该网格存在一个对象Object,那么它是C_i的概率是P(C_i|Object)。

2)2个bounding box的位置
每个bounding box需要4个数值来表示其位置,(Center_x,Center_y,width,height),即(bounding box的中心点的x坐标,y坐标,bounding box的宽度,高度),2个bounding box共需要8个数值来表示其位置。

3)2个bounding box的置信度
bounding box的置信度 = 该bounding box内存在对象的概率 * 该bounding box与该对象实际bounding box的IOU,用公式来表示就是:
在这里插入图片描述
==Pr(Object)==是bounding box内存在对象的概率,区别于上面1)中的P(C_i|Object),==Pr(Object)==并不管是哪个对象,它体现的是 有或没有 对象的概率。1)中的P(C_i|Object),意思是假设已经有一个对象在网格中了,这个对象具体是哪一个。

写的很好的博文,附上超链接:

https://www.jianshu.com/p/cad68ca85e27

https://blog.youkuaiyun.com/shuiyixin/article/details/82533849

https://zhuanlan.zhihu.com/p/35416826

https://zhuanlan.zhihu.com/p/66265586

精品如下:
https://zhuanlan.zhihu.com/p/183781646

在这里插入图片描述

https://www.cnblogs.com/xiongzihua/p/9315183.html

在这里插入图片描述
https://blog.youkuaiyun.com/weixin_41009689/article/details/106036687

在这里插入图片描述

https://github.com/TowardsNorth/yolo_v1_tensorflow_guiyu

在这里插入图片描述
我认真读的两篇博客:

https://blog.youkuaiyun.com/c20081052/article/details/80236015
yolov1-1

https://blog.youkuaiyun.com/shuiyixin/article/details/82533849
yolov1-2

https://blog.youkuaiyun.com/qq_43360533/article/details/107992817
yolov1论文详解

论文中的网络结构图:
https://zhuanlan.zhihu.com/p/220062200
https://zhuanlan.zhihu.com/p/220062200

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值