目标检测总结:SSD
之前回顾了one-stage目标检测中的Yolo系列,本文介绍另一种 one-stage 框架——SSD。
思想:
- 多尺度的特征层用于目标检测,如下图所示,共有6个不同尺度的特征层进行预测。
- 基于卷积的预测器,SSD通过卷积操作对对应特征层进行预测。
- 默认的边界框和长宽比,与faster RCNN类似,ssd预先指定anchor的大小,但不同的是SSD是把anchor应用到不同分辨率的特征映射中。
- 匹配策略,gtbox可能与多个anchor重叠,SSD将gtbox与gtbox的IOU>0.5的anchor相匹配,也就是允许多个重叠的anchor负责预测同一个gtbox,这简化了学习问题。
- 目标函数:
与fasterRCNN类似,ssd对于坐标回归的目标也是偏移量。 - 默认边界框的长宽比以及尺度:
Smin取0.2,Smax取0.9,这意味着最低层有0.2的尺度,最高层有0.9的尺度,长宽比有1,2,3,1/2,1/3,我们可以为每个边界框计算w和h,另外中心点为(0,