一,SSD
one-stage结构,在YOLO基础上加入先验框和多尺度预测。
1,贡献
(1)多尺度预测;
(2)使用一系列3*3大小的卷积核得到相对于先验框的偏移和类别分数(YOLO用的全连接),每个m*n大小的feature map一共有(c+4)*k*m*n个输出,c是类别,k为每个box输出的框的个数;
(3)端到端训练。
2,训练
(1)匹配策略
首先给每个真实框匹配IoU最大的先验框,以保证每个真实框都被匹配;然后,向每个默认框匹配IoU大于阈值(论文中取0.5)的真实框。
(2)loss function
首先,令,表示第i个先验框和第j个真实框的匹配关系,P表示种类,1就是匹配,0就是不匹配。
总损失函数: