——为什么会阅读这篇论文?原因很简单:SSD比Faster R-CNN准、比YOLO快。
——论文出处: UNC Chapel Hill(北卡罗来纳大学教堂山分校) 的 Wei Liu 新作
——论文代码:https://github.com/weiliu89/caffe/tree/ssd
——本文宗旨:拒绝逐行逐句翻译,从我的理解我的角度,综合很多博客论文的看法来深入分析SSD
Single Shot Multibox Detector
一、论文总体观:
1.1、总体观:
-
-
SSD方法提供了一套建立在一个简单网络上的目标检测的方法:一方面,通过人为事先设定默认框的坐标,通过网络的学习训练,与真实框的损失计算,逐渐回归到接近真实尺度;另一方面,该神经网络还会在多个卷积层输出相应类别预测;结合上面位置尺度、类别预测,SSD可以省略其他神经网络惯用的姿态:随机假设目标框、小管道候选、像素重采样、特征重采样、然后需要高效分类器:这些方法套路依托深层次的特征计算,对实时的检测时间花销更大,而且只能牺牲准确度来实现提速(比Faster R-CNN准、比YOLO快)——因此时间上有了很大的提高并且准确率上也是有所提升。本方法在仿真上主要在PASCAL VOC2007上进行训练和评估,并且最后在PASCAL VOC2012上进行测试。
-
所以,SSD快在省略了随机假设目标框、小管道候选、像素重采样、特征重采样等步骤;准确在整合每一层卷积层输出的预测信息(包括类别和四个位置偏移量),没有丢掉细小的信息;速度和准度两者的平衡靠的是端对端的训练;
-