深度网络中的目标检测算法YOLO系列-YOLOv3论文理解

一、简述

将好的方案进行融合到YOLO中.

改进:调整了网络结构;利用多尺度特征进行对象检测,对象分类用logigtic取代了softmax。

二、新的网络结构 Darknet53

在基本的图像特征提取方面,YOLOv3采用了Darknet63(含有53个卷积层),借鉴了残差网络resnet的做法。

三、利用多尺度特征进行检测

在这里插入图片描述
使用了3个不同尺度的卷积图来进行目标检测。

  1. 卷积网络在79层后,经过n个卷积层得到一种尺度的检测结果。相对输入,这个检测特征图有32倍的下采样。比如输入是416416,这个特征图就是1313了。由于下采样倍数高,特征图的感受野比较大,相应的其适合检测的目标尺寸也是大尺寸对象。
  2. 为了实现细粒度的检测(v2),第79层的特征图开始做上采样,然后与第61层特征图融合,这样得到了91层,较细粒度的特征图,同样经过了n个卷积层,得到相对于图像16倍下采样的特征图。它具有中等尺度的感受野,适合检测中等尺度的特征。
  3. 最后,第91层上采样,与第36层特征图融合,得到相对输入图像6倍下采样的特征图,它的感受野最小,适合小目标。
    在这里插入图片描述

四、9种尺度的先验框(Anchor boxes)

随着检测特征图尺寸的变换,Anchor boxes尺寸也相应的调整。在YOLOv2中,采用k-mean聚类方式得到Anchor boxes尺寸大小。YOLOv3也采用这样方式,为了每一个尺寸 设计了3个anchor boxes尺寸。共聚类出9种尺寸的Anchor boxes,用于检测3种大小的目标。
在这里插入图片描述

五、 对象分类softmax改为logistic

预测对象类别时,不使用softmax,改为使用logistic的输出进行预测。当一个区域框中,含有多个目标时,可进行多类别预测。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值