yolo理解

1.将输入图像分为S*S份,如7*7,每个网格进行预测,即有两次(实际为B)猜的机会,一次猜5+C个数,分别为目标矩形中心坐标(x,y),宽度w,高度h,以及该预测矩形与gt的IOU,可理解为一个概率值(最终选择哪个框主要看概率,概率大保留,概率小排除),以及该目标对应C个类别的概率,如:车、人等。最终得到S*S*(5*B+C)维矩阵。

2.与真实值对比,每个网格有无目标已知(1或者0),有目标物体的话,根据gt就能知道该网格对应的真实x,y,w,h为多少,所属类别已知,IOU根据pred_box和gt_box计算。

3、损失计算:每个预测是范围不同,影响不同,直接用均方差不适合。如:x、y、w、h被归一化到当前网格, 范围[0,1],在回归过程中主要关注坐标,因此加权值较大,论文中取5;如果网格里没有目标,p=0,此时标签近似为0,则不太需要关注其回归情况,取较小的权值(0.5)减小影响;减小窗口大小对小目标的影响,开根号


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值