YOLO复现

本文介绍了使用PyTorch实现YOLOv3的主要思想,包括将图片划分为S*S个cell,每个cell预测B个boundingbox,每个box包含5个参数。坐标以相对值表示,网络输出维度为S*S*(B*5+C),其中C为类别数。通过网络结构示意图,展示YOLOv3的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

代码:

PyTorch-YOLOv3

主要思想:

 1.一张图片分成S*S个cell,如果一个object的中心落在某一个cell,那么这个cell就负责预测这个object;

2.每个cell需要预测B个boundingbox(论文中B=2),每个boundingbox中有五个参数:(X,Y,W,H,C)X,Y是该boundingbox中心点的坐标,W和H是长和宽;conference是有没有object的置信度(这里的conference负责看有没有object,至于是哪一个object不是它负责),它是由两部分组成:一是看cell里是否有对象,而是boundbox的准确度。

3.这里的X和Y的坐标是bondingbox的中心点相对于负责预测它的cell的坐标的相对值,而不是相对于整个图片的绝对值。W和H是该boundingbox的长和宽相对于整个图片的长和宽的相对值。这样做的话X,Y,W,H的值都在0-1之间。

4.每个cell需要预测C个条件概率(这里的C是class的数目,VOC2007数据集中c=20),按照这个计算,输出维度就是S*S*(B*5+C)。

5.网络结构示意图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值