Single Shot Detection(SSD)bbox prediction相关的(超)参数

本文详细解析SSD(Single Shot Detection)模型中与边界框预测相关的超参数,包括image_size(图片大小)、num_classes(类别数)、feat_layers(特征层)、feat_shapes(特征层形状)、anchor_size_bounds(锚点大小范围)等,探讨这些参数如何影响SSD的性能和训练过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考https://github.com/balancap/SSD-Tensorflow 记录SSD中与bbox prediction相关的(超)参数。



ssd_vgg_300.py

SSDParameters(
    img_shape=(300, 300), 
    num_classes=21, 
    no_annotation_label=21, 
    feat_layers=['block4', 'block7', 'block8', 'block9', 'block10', 'block11'], 
    feat_shapes=[(38, 38), (19, 19), (10, 10), (5, 5), (3, 3), (1, 1)], 
    anchor_size_bounds=[0.15, 0.9], 
    anchor_sizes=[(21.0, 45.0), (45.0, 99.0), (99.0, 153.0), (153.0, 207.0), (207.0, 261.0), (261.0, 315.0)], 
    anchor_ratios=[[2, 0.5], [2, 0.5, 3, 0.3333333333333333], [2, 0.5, 3, 0.3333333333333333], [2, 0.5, 3, 0.3333333333333333], [2, 0.5], [2, 0.5]], 
    anchor_steps=[8, 16, 32, 64, 100, 300], 
    anchor_offset=0.5, 
    normalizations=[20, -1, -1, -1, -1, -1], 
    prior_scaling=[0.1, 0.1, 0.2, 0.2]
)

image_size

SSD中没有全连接层, 可适应各种大小的图片。指定图片大小的目的是为了方便成batch训练。

num_classes

待检测的物体类别数量, 一般还需要加上背景类。

no_annotation_label

没用

feat_layers

特征层。使用哪几层来预测bbox

feat_shapes

特征层的shape

anchor_size_bounds

每个特性层上的anchor大小都不一样, 越靠近输入的层其anchor越小。
确定第一个与最后一个feature层的anchor大小以后, 处于中间的层的anchor大小则通过线性插值计算而来。例如,假如anchor_size_bounds = [0.2, 0.7], 有6个feature layer,则每个layer对应的default anchor大小为:[0.2, 0.3, 0.4, 0.5, 0.6, 0.7].

anchor_sizes

这个不是超参数。
它是论文中 s

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值