YOLO复现

握紧拳头的小人物

于 2020-01-07 20:29:26 发布

阅读量514

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u012953338/article/details/103881142

版权

本文介绍了使用PyTorch实现YOLOv3的主要思想，包括将图片划分为S*S个cell，每个cell预测B个boundingbox，每个box包含5个参数。坐标以相对值表示，网络输出维度为S*S*(B*5+C)，其中C为类别数。通过网络结构示意图，展示YOLOv3的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码：

PyTorch-YOLOv3

主要思想：

1.一张图片分成S*S个cell，如果一个object的中心落在某一个cell，那么这个cell就负责预测这个object；

2.每个cell需要预测B个boundingbox（论文中B=2），每个boundingbox中有五个参数：（X,Y,W,H,C）X，Y是该boundingbox中心点的坐标，W和H是长和宽；conference是有没有object的置信度（这里的conference负责看有没有object，至于是哪一个object不是它负责），它是由两部分组成：一是看cell里是否有对象，而是boundbox的准确度。

3.这里的X和Y的坐标是bondingbox的中心点相对于负责预测它的cell的坐标的相对值，而不是相对于整个图片的绝对值。W和H是该boundingbox的长和宽相对于整个图片的长和宽的相对值。这样做的话X,Y,W,H的值都在0-1之间。

4.每个cell需要预测C个条件概率（这里的C是class的数目，VOC2007数据集中c=20）,按照这个计算，输出维度就是S*S*(B*5+C)。

5.网络结构示意图：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。