[深度学习]目标检测框架——SSD

SSD是一种目标检测框架,它通过不同尺度的特征图进行预测,使用VGG16作为基础网络,并结合Default Box生成与多尺度预测。训练过程中采用IOU匹配原则,数据增强策略和Hard Negative Mining,损失函数包括分类Loss与回归Loss。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、简介

SSD只需要一张输入图片和ground truth box(真实的边界框)就可以开始训练.
1、在不同尺寸特征图的每个位置上,选取不同长宽比生成一系列的default box,在用卷积预测classification+buonding box regression二部分【1是各个类别的置信度或者评分,2是边界框的预测值l=(l^{cx}, l^{cy}, l^w, l^h) 】
2、l是default box 相对于边界框的转换值

一、网络结构

SSD用11conv层网络提取特征,最后用两层conv在不同的尺度的feature map上进行预测

VGG

注:默认conv:k_size=[3,3] stride=[1,1] padding = 'same'   最大池化:pool_size=[2,2],stride = [2,2]
提取特征---SSD(11层),其前5层是基于VGG16,只将VGG16第五层的max_pool改为pool_size =[3,3]  stride=[1,1]
第6层(1conv)   1024filter  k_size=[3,3]   空洞卷积(扩张率=6) 
第7层(1conv)   1024filter  k_size=[1,1] 
第8层(2conv)   1conv  256filter  k_size=[1,1]  1conv  512filter stride=[2,2]  padding='vaild' 
第9层(2conv)   1conv  128filter  k_size=[1,1]  1conv  256filter stride=[2,2]  padding='vaild'
第10层(2conv) 1conv  128filter  k_size=[1,1]  1conv  256filter padding='vaild'
第11层(2conv) 1conv  128filter  k_size=[1,1]  1conv  256filter padding='vaild'

三、特点

1、Default Box /Prior Box生成

论文中利用不同层的 feature map 来模仿学习不同尺度下物体的检测。

  • :若计算第1个特征图的scale,则K=1,计算第2个特征图的scale,则K=2.........

示例: (取Smin=0.2   Smax =0.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值