目标检测SSD算法（新手入门）

最新推荐文章于 2024-08-12 14:50:42 发布

原创

最新推荐文章于 2024-08-12 14:50:42 发布 · 2.2w 阅读

·

65

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #神经网络

SSD，即Single Shot MultiBox Detector，是一种经典的目标检测算法，它结合了YOLO的回归思想和Faster-RCNN的Anchor机制，使用全图各个位置的多尺度区域特征进行回归，既保持了YOLO的速度，也提高了检测精度。SSD采用CNN直接进行检测，提取不同尺度的特征图，利用不同尺度和长宽比的先验框，有效检测小目标。

SSD分析

SSD背景
SSD Framework
CNN-based detector
SSD的backbone：VGG16
SSD Model
L2Norm
先验框
多尺度对SSD的影响
定位、分类
小结
问题

SSD算法是比较经典的目标检测算法，讲解SSD的博客有很多，比如目标检测之SSD就讲的非常好。

本篇博客的不同之处在于，我当时整理学习SSD的时候相对小白一点，遇到什么不太清楚的查阅的东西比较多一些。除了讲解SSD，也分析了一些SSD和YOLO等算法的差别，以及从实际应用、部署的角度来看SSD。

在此把当时记录的东西整理出来分享给大家。文中参考了很多人的博客、知乎、帖子，很惭愧当时没有记录下来。

SSD背景

在这里插入图片描述
SSD算法，其英文全名是Single Shot MultiBox Detector，名字取得不错，Single shot指明了SSD算法属于one-stage方法，MultiBox指明了SSD是多框预测。

看左图，SSD算法在准确度和速度（除了SSD512）上都比Yolo要好很多（当时）
右图是不同算法的基本框架图，对于Faster R-CNN，其先通过CNN得到候选框，然后再进行分类与回归，而Yolo与SSD可以一步到位完成检测。

相比Yolo，SSD采用CNN来直接进行检测，而不是像Yolo那样在全连接层之后做检测。其实采用卷积直接做检测只是SSD相比Yolo的其中一个不同点，另外还有两个重要的改变，

一是SSD提取了不同尺度的特征图来做检测，大尺度特征图（较靠前的特征图）可以用来检测小物体，而小尺度特征图（较靠后的特征图）用来检测大物体；
二是SSD采用了不同尺度和长宽比的先验框（Prior boxes, Default boxes，在Faster R-CNN中叫做锚，Anchors）。Yolo算法缺点是难以检测小目标，而且定位不准，但是这几点重要改进使得SSD在一定程度上克服这些缺点。

SSD Framework

在这里插入图片描述
CNN网络一般前面的特征图比较大，后面会逐渐采用stride=2的卷积或者pool来降低特征图大小（比如YOLOV3不用pool，全部用stride=2的卷积）

这正如上图所示，一个比较大的特征图和一个比较小的特征图，它们都用来做检测。这样做的好处是比较大的特征图来用来检测相对较小的目标，而小的特征图负责检测大目标。

在Yolo中，每个单元预测多个边界框，但是其都是相对这个单元本身（正方块），但是真实目标的形状是多变的，Yolo需要在训练过程中自适应目标的形状。
而SSD借鉴了Faster R-CNN中anchor的理念，每个单元设置尺度或者长宽比不同的先验框，预测的边界框（bounding boxes）是以这些先验框为基准的，在一定程度上减少训练难度。

一般情况下，每个单元会设置多个先验框，其尺度和长宽比存在差异，如图所示，可以看到每个单元使用了4个不同的先验框，图片中猫和狗分别采用最适合它们形状的先验框来进行训练。

值得注意的是SSD将背景也当做了一个特殊的类别，如果检测目标共有 c 个类别，SSD其实需要预测 c+1 个置信度值，其中第一个置信度指的是不含目标或者属于背景的评分

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。