TensorFlow object detection API部分原理之SSD算法

本文深入解析了SSD(Single Shot MultiBox Detector)算法的工作原理及其网络结构。通过VGG-16作为基础网络,并结合多个不同尺度的特征图进行目标检测,详细介绍了每个特征层的配置参数与作用。
部署运行你感兴趣的模型镜像

一、SSD(Single Shot MultiBox Detector)算法

SSD算法是Faster R-CNN和YOLO的组合,因此性能方面能比两者好一些。

img

SSD的网络结构图:

看图分析:

①首先是一个VGG-16的卷积层

其中Conv4_3层,      Classifier:Conv:3*3*(4*(Classes+4))

因此这一层提取出的feature map=38*38

②接着是两个卷积层(FC6、FC7)

其中Conv6/7层,      Classifier:Conv:3*3*(6*(Classes+4))

因此这一层提取出的feature map=19*19

③最后是Extra Feature Layers层

其中Conv10_2层,   Classifier:Conv:3*3*(4*(Classes+4))

因此这一层提取出的feature map=3*3

 

在Classifier中:

Classes是识别的种类数;

加号后面的4是x,y,w,h坐标;

绿色的数字是指default box的数量。

4个default box 是长宽比为(1:1)、(2:1)、(1:2)、(1:1)

6个default box 是长宽比为(1:1)、(2:1)、(1:2)、(1:1)、(1:3)、(3:1)

【两个(1:1)并不是重复错误,而是公式原因】
  

    Conv4_3  feature map:38*38————38*38*4 = 5776

  Conv7    feature map:19*19————19*19*6 = 2166

  Conv8_2  feature map:10*10————10*10*6 = 600

  Conv9_2  feature map:5 * 5————5 *5 *6 = 150

  Conv10_2 feature map:3 * 3————3 * 3 *4 = 36

  Conv11_2 feature map:1 * 1————1 * 1 *4 = 4

    5776+2166+600+150+36+4=8732

 

img

 

Sk相对于图片的比例
m一共有多少层feature map
k当前是第几层feature map
Smin第一层所占比例,在SSD300中为0.2
Smax最后一层所占比例,在SSD300中为0.9
ardefault box比例

wk=Sk*\sqrt{ar}

hk=Sk/\sqrt{ar}

Sk'=\sqrt{Sk*Sk+1}

默认情况下,会有一个ar=1的Sk和一个Sk',这就是两个(1:1)的原因

 

default box中心点坐标:\left ( ( i+0.5)/\left | f_{k} \right |, ( j+0.5)/\left | f_{k} \right |\right )

i在feature map中的水平第几格
j在feature map中的垂直第几格
fk在第k层的feature map大小

【损失函数】

img

 

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值