【目标检测】YOLOv3总结

本文围绕YOLOv3展开,介绍其要解决在YOLOv2基础上改进的问题,采用DarkNet - 53结构等方法。阐述了模型细节,如边界框预测、类别预测等。指出其在小目标检测表现不错,但中、大目标检测效果不佳,还提及一些尝试未成功的方法及不同数据集上的测试效果。
部署运行你感兴趣的模型镜像

本文笔记链接(建议使用链接观看):
Yolov3总结链接
以下为笔记基本内容样例
03.YOLOv3
📄论文题目
YOLOv3: An Incremental Improvement
👨‍💻作者
Joseph Redmon:YOLO系列的主要作者
❓四个问题
❔要解决什么问题?
在YOLOv2的基础上更强更好,同时对YOLOv2中的一些模块进行改进,并且尝试将其他作者提供的一些新的想法融入YOLOv3中。
❔使用什么方法解决问题?
DarkNet-53的具体结构:在DarkNet-19上进行改进加入更多的 33 和11卷积层

具体网络结构模型

LOSS计算:

❔实际效果如何?

❔还存在什么问题?
对于中目标和较大目标的检测效果不佳
Fcoal LOSS 的引入值得进一步探讨
✨论文概述
🔸1.Abstract
YOLOv3模型比V2更加大一点,但是更加的准确,与SSD的精度相当但是检测速度是SSD的三倍左右。
🔹2.Introduction
本文是一篇类似技术报告的论文,在本文末尾会介绍一些yolov3之后的研究方向,并且相关工作以及失败的尝试。
🔸3.The Deal
YOLOv3的细节:
从其他作者中获得更好的想法
训练一个新的分类器

3.1 Bounding Box Prediction

3.2 Class Prediction
使用独立逻辑的分类器,在训练过程中使用二元交叉墒进行类别的预测。
3.3Predictions Across Scales
使用三种不同尺度的Boxes进行预测(与金字塔特征提取类似),每个比例下预测3个盒子,因此对于4个边界盒子偏移、1个对象预测和80个类别预测,N×N ×[ 3*(4+1+80)]。
对之前的2个特征图中进行2倍的上采样结合在网络前期获得的特征图进行合并(获得更多的语义信息)从早期的特征映射中获得更多细粒度的信息,再添加几个卷积层来处理这个组合特征图,并最终预测一个相似的张量,尽管现在是两倍的大小。
依旧使用K-均值聚类来进行边界框的先验。只是选择了9个Clusters和3个不同的尺度。
注:在COCO数据集上:9个聚类是:(10×13),(16×30),(33×23),(30×61),(62×45),(59× 119),(116 × 90),(156 × 198),(373 × 326)
3.4 特征提取器
为Darknet-53,在Darknet-19的基础上使用多个连续的33与11卷积层。Darknet-53整体上比Darknet19强大得多,但仍然比ResNet-101或ResNet-152高效

3.5 Training
使用多尺度训练、数据扩充、批标准化等一系列标准(一般都会进行的处理操作)的操作在Darknet-53上进行训练。
🔹4.How We Do
在IOU = 0.5 的情况下,yolov3的性能与RetiaNat相差无几
当IOU逐渐增大时,性能会显著下降(说明YOLOv3的检测框很难与目标对齐)
YOLOv3在小目标上的检测有不错的表现(通过多尺度预测)
YOLOv3在中等及较大尺寸的目标检测效果不佳
🔸5.Things We Tried That Didn’t Work
使用正常的锚框预测机制发现模型的稳定性降低
使用线性预测X,Y,而不是逻辑预测,mAP下降几点
Focal oss : mAP下降2个点
Dual IOU thresholds and truth assignment: IOU>0.7为正样本,IOU<0.3为负样本
🔹6.What This All Means
YOLOV3在0.5-0.95IOU的COCO数据集(新)上测试效果不是很好,但是在旧的测试集上测试效果非常好。
👀补充
附录

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值