主要和faster rcnn放在一起,对比着看。上图:
与faster rcnn的不同
1. 网络结构不用,也就是one stage和two stage的区别,SSD不需要预先生成propasal box而能直接输出网络最终的预测结果。
2. anchor的设置不用,这个是个很大的区别,faster rcnn只在一层feature map上做操作,所以为了是实现多尺度的框,设置了不用的尺度(128,256,512),并设置了不同的ratio,1,1/2,1/3这样,注意这个比例是面积的比例,实际的长宽放缩ratio要变换的,并且生成的anchor并没有按照feature map的尺度进行归一化.SSD的anchor是出现在不同的层上面的,每个层上anchor的尺度是算出来的,并且所有anchor的尺度根据当前层的feature map 大小进行归一化。
3.SSD有OHNM,困难样本挖掘,困难样本挖掘仅适用于分类损失,做法是先将所有样本通过cross entropy Loss,将正样本全部都要,然后在负样本中挑选损失高的一些,保证正负样本的比例为1:3
4.SSD有数据增强。