文章目录
引言
因为之前做的项目用了一下SSD,用的是github上的pytorch开源版本,认真读了一下paper,code也调通了并且训练了自己的数据。在这里记录一下SSD的详解。
论文链接
caffe源码(作者官方代码)
pytorch源码
SSD的主要思想在于,用不同尺度的feature map,来预测不同大小、形状的目标。浅层的feature map用于预测较小的目标,高层的预测较大的。通过事先为每个feature map的每一处指定多个default box(分别预测不同形状),并预测图像中目标相较default box的偏移,以及default box的类别,来实现对目标位置和类别的预测。
这一成果发表在ECCV2016上,在当时的效果是要优于同为one-stage检测器yolo的。
但是后来yolo系列又经历了yolov2和yolov3两个版本的发展,就盖过了SSD系列的风头。可以看到,yolov3在第二象限一枝独秀。
说句题外话,三天前arxiv上新出了一篇slimYOLOv3(paper链接),看起来比YOLOv3要更优秀一些,性能如下图,且已经开源(pytorh源码链接)之后可以关注一下。
前几个月还有一篇《Objects as Points》提出了centernet,性能也非常优越,也已经开源(pytorch源码)。(ps,此篇是anchor-free的)