概述
传统的目标检测任务主要通过人工提取特征模型建立,常用的特征包括:HOG、SIFT、Haar等,特征提取模型之后进行支持向量机或者Adaboost的分类任务,进而得到我们所关注的目标结果。由于特征模型的局限性,我们引入卷积特征,也就是经过卷积神经网络得到的特征信息,包括浅层信息和深层信息,浅层信息指的是:前级的卷积层得到的特征图,感受野更加关注的是图像细节纹理等特征。深层信息包括:后级的卷积层卷积得到的特征图信息,在语义语境方面更加抽象的高层信息。人工神经网络是根据大脑神经突触联接的结构进行信息处理的数学模型,视觉模拟系统通过稀疏编码的方式组合成为合理并且高效的图像处理系统。
参考论文:
《What makes for effective detection proposals?》
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》
《Region-based Convolutional Networks for AccurateObject Detection and Segmentation》
《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》
《You Only Look Once : Unified, Real-Time Object Detection》
《SSD: Single Shot MultiBox Detector》
《YOLO9000: Better, Faster, Stronger》
下面主要针对卷积神经网络的目标检测算法进行总结(包括以下(2)--(6)):
(1) 传统方法(DPM)
(2) R-CNN(卷积特征)
(3) SPP-NET/Fast R-CNN(卷积特征)
(4) Faster R-CNN(卷积特征)
(5) YOLO (v1 & v2)(卷积特征)
(6) SSD(卷积特征)