ssd网络forward理解

本文深入解析SSD网络结构,包括vgg主干网络及额外层、关键特征图层、loc与conf分支网络。详述从输入到输出的完整数据流,解释8732个先验框的由来,并概述置信度筛选、真实框坐标解码及NMS去重等后续操作。

1.网络结构

主干网络:vgg + extras
分支网络:conf与loc网络

2.数据流

ssd中6层关键feature_map层,其feature_map的shape如下:
  • n, 512, 38, 38
  • n, 1024, 19, 19
  • n, 512, 10, 10
  • n, 256, 5, 5
  • n, 256, 3, 3
  • n, 256, 1, 1
分别经过了loc和conf层后, shape成为了
  • loc-----------------------------------------------------------conf
  • n, 16, 38, 38 --------------------------------------n, 84, 38, 38
  • n, 24, 19, 19---------------------------------------n, 126, 38, 38
  • n, 24, 10, 10---------------------------------------n, 126, 38, 38
  • n, 24, 5, 5-------------------------------------------n, 126, 38, 38
  • n, 16, 3, 3-------------------------------------------n, 84, 38, 38
  • n, 16, 1, 1-------------------------------------------n, 84, 38, 38
分别拉平concate起来, 其shape分别为

loc_data : n x 34928 --------> n x 8732 x 4 -------- >4个坐标
conf_data : n x 183372-------> n x 8732 x 21-------->21个分类
(ssd一定要记住 8732 这个数字, 别问我为什么, 这是 先验框个数 )

后续操作

根据conf_data中的置信度进行阈值筛选, decode_boxes(即根据先验框与loc_data,找到真实框坐标)
再用nms去重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值