SSD 网络基本原理记录

本文详细介绍了SSD(Single Shot MultiBox Detector)网络的原理和实现,包括网络结构、多尺度特征图、卷积检测、先验框设定、训练过程和预测过程。SSD通过采用多尺度特征图、卷积检测和不同长宽比的先验框,提高了目标检测的准确性,相比YOLO有所改进。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

由于是从Word文档直接复制过来,其中格式如果乱码或者不通顺,请评论区告知我

参考链接:
https://blog.youkuaiyun.com/qq_41185868/article/details/86548830
https://zhuanlan.zhihu.com/p/33544892

一、网络结构图

在这里插入图片描述
在这里插入图片描述

二、SSD原理与实现

https://zhuanlan.zhihu.com/p/33544892
1、SSD和YOLO相同和不同
相同:都是one-stage方法;
不同点:

  • 1)SSD采用CNN来直接进行检测;Yolo在全连接层之后做检测(Yolov1包含有全连接层,从而能直接预测 Bounding Boxes 的坐标值。 作者发现通过预测偏移量而不是坐标值能够简化问题,让神经网络学习起来更容易。所以从yolov2开始已经去掉了)
  • 2)SSD提取了不同尺度的特征图来做检测,大尺度特征图(较靠前的特征图)可以用来检测小物体,而小尺度特征图(较靠后的特征图)用来检测大物体;(这个yolo在后面的版本中也借鉴了这个优点)
  • 3)SSD采用了不同尺度和长宽比的先验框(Prior boxes, Default boxes,在Faster R-CNN中叫做锚,Anchors)

2、设计思路
图3
1)采用多尺度特征图用于检测
所谓多尺度采用大小不同的特征图(feature map),CNN网络一般前面的特征图比较大,后面会逐渐采用stride=2的卷积或者pool来降低特征图大小,这正如图3所示,一个比较大的特征图和一个比较小的特征图,它们都用来做检测。这样做的好处是比较大的特征图(同场景视角但清晰)来用来检测相对较小的目标,而小的特征图(同场景视角但模糊)负责检测大目标,==(即大特征图每个单元格(像素)包含的场景小&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值