SSD目标检测算法中default box在ssd_pascal.py的设置

最新推荐文章于 2024-06-13 19:56:43 发布

原创最新推荐文章于 2024-06-13 19:56:43 发布 · 1.9k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#SSD #default box #prior boxes #目标检测

机器学习专栏收录该内容

27 篇文章

订阅专栏

本文详细解析了SSD目标检测模型中default boxes的生成过程，包括各特征层的选取、不同尺度与长宽比的设置原理及作用，帮助理解SSD如何在不同尺度上检测物体。

在ssd_pascal.py中对default boxes（prior boxes）的设置由如下代码完成：

# parameters for generating priors.
# minimum dimension of input image
min_dim = 300
# conv4_3 ==> 38 x 38
# fc7 ==> 19 x 19
# conv6_2 ==> 10 x 10
# conv7_2 ==> 5 x 5
# conv8_2 ==> 3 x 3
# conv9_2 ==> 1 x 1
mbox_source_layers = ['conv4_3', 'fc7', 'conv6_2', 'conv7_2', 'conv8_2', 'conv9_2']
# in percent %
min_ratio = 20
max_ratio = 90
step = int(math.floor((max_ratio - min_ratio) / (len(mbox_source_layers) - 2)))
min_sizes = []
max_sizes = []
for ratio in xrange(min_ratio, max_ratio + 1, step):
  min_sizes.append(min_dim * ratio / 100.)
  max_sizes.append(min_dim * (ratio + step) / 100.)
min_sizes = [min_dim * 10 / 100.] + min_sizes
max_sizes = [min_dim * 20 / 100.] + max_sizes

steps = [8, 16, 32, 64, 100, 300]
aspect_ratios = [[2], [2, 3], [2, 3], [2, 3], [2], [2]]
# L2 normalize conv4_3.
normalizations = [20, -1, -1, -1, -1, -1]
# variance used to encode/decode prior bboxes. prior_variance实际上是一种bounding regression中的权重
if code_type == P.PriorBox.CENTER_SIZE:
  prior_variance = [0.1, 0.1, 0.2, 0.2]
else:
  prior_variance = [0.1]

mbox_source_layers即产生box的层，一共有6个，可看成6个feature map，尺度分别为38*38，3*3，1*1，19*19，10*10，5*5

现在重点看box的大小是怎么设置的，box比例为

aspect_ratios = [[2], [2, 3], [2, 3], [2, 3], [2], [2]]

第一个[2]即有[1,2,1/2]三个比例，其中1对应最大和最小的正方形尺度，所以此map上的box有4个尺度

[2, 3]即有[1,2,1/2,3,1/3],同样1对应最大和最小的正方形尺度，所以此map上的box有6个尺度

ssd中，对于6个feature map，每个map中box的ratios：38*38，3*3，1*1map都是4个，19*19，10*10，5*5都是6个

steps = [8, 16, 32, 64, 100, 300]又是什么？

steps其实是box映射回原图的比例因子，即default box在feature map上的尺度乘以steps中的值，则对应到输入的原图上的尺度，这里原图是300×300。

为什么映射回原图，看我之前一篇http://blog.youkuaiyun.com/tigerda/article/details/78527870 中anchor部分