深度网络中的目标检测算法YOLO系列-YOLOv3论文理解

AN ZE

于 2019-07-18 23:41:00 发布

阅读量1.2k

点赞数 1

分类专栏：目标检测深度学习文章标签：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_39341555/article/details/96465234

版权

深度学习同时被 2 个专栏收录

12 篇文章

订阅专栏

11 篇文章

订阅专栏

一、简述

将好的方案进行融合到YOLO中.

改进：调整了网络结构；利用多尺度特征进行对象检测，对象分类用logigtic取代了softmax。

二、新的网络结构 Darknet53

在基本的图像特征提取方面，YOLOv3采用了Darknet63(含有53个卷积层)，借鉴了残差网络resnet的做法。

三、利用多尺度特征进行检测

在这里插入图片描述
使用了3个不同尺度的卷积图来进行目标检测。

卷积网络在79层后，经过n个卷积层得到一种尺度的检测结果。相对输入，这个检测特征图有32倍的下采样。比如输入是416416，这个特征图就是1313了。由于下采样倍数高，特征图的感受野比较大，相应的其适合检测的目标尺寸也是大尺寸对象。
为了实现细粒度的检测(v2)，第79层的特征图开始做上采样，然后与第61层特征图融合，这样得到了91层，较细粒度的特征图，同样经过了n个卷积层，得到相对于图像16倍下采样的特征图。它具有中等尺度的感受野，适合检测中等尺度的特征。
最后，第91层上采样，与第36层特征图融合，得到相对输入图像6倍下采样的特征图，它的感受野最小，适合小目标。

四、9种尺度的先验框(Anchor boxes)

随着检测特征图尺寸的变换，Anchor boxes尺寸也相应的调整。在YOLOv2中，采用k-mean聚类方式得到Anchor boxes尺寸大小。YOLOv3也采用这样方式，为了每一个尺寸设计了3个anchor boxes尺寸。共聚类出9种尺寸的Anchor boxes，用于检测3种大小的目标。
在这里插入图片描述

五、对象分类softmax改为logistic

预测对象类别时，不使用softmax，改为使用logistic的输出进行预测。当一个区域框中，含有多个目标时，可进行多类别预测。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。