跟着问题学3.6——YOLO v1详解及代码实战

目标检测任务描述

(1)输入一张图片,图片上有个目标,那么该如何描述目标在图像上的位置呢?我们知道,图像是长*宽的尺寸的像素点组成的,可以在图像上设置图像坐标系(比如以左上角为坐标原点,向右向下分别为x,y轴正方向),然后就可以使用边界框选中目标,边界框使用在图像坐标系上的坐标来表示,如下图,x,y,w,h,其中(x,y)是边界框左上角的像素坐标,w,h分别是边界框的宽和高。

(2)边界框还有其它表示方法,核心就是描述边界框在整张图像上的位置,如下:

p1,p2,p3,p4(4个点坐标)

cx,cy,w,h(cx,cy为中心点坐标)

x,y,w,h,angle(还有的目标是有角度的,这时叫做Rotated Bounding Box)

  1. 那么该如何预测这个边界框呢?传统方法是设定很多很多个边界框,从图像的左上角直到右下角,每个像素点都设置多个边界框(边界框的大小可以变化),如下图所示,这也是R-CNN系列模型所采用的思想,但这种思路的最大问题是耗时和操作复杂,需要手动生成大量的样本。比如输入图片大小是(800,1000)也就意味着有800000个位置。窗口大小最小1*1 ,最大800*1000(极限,具体应用时会优化) ,所以这个遍历的次数是无限次

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值