目标检测最新总结文献 :
1《Deep Learning for Generic Object Detection A Survey》 下载地址
2.《Object Detection in 20 Years: A Survey》下载地址
GitHub:下载地址
目标检测是将图像或者视频中的目标与其他不感兴趣区域进行区分,判断是否存在目标,确定目标位置,识别目标种类的计算机视觉任务。
以AlexNet为分界线,2012年之前为传统算法,2013年之后为深度学习算法。
一、目标检测传统算法
包括:
``
1、Viola-Jones算法
2、HOG 特征算法
3 DPM 模型
``
二、 基于深度神经网络的目标检测与识别
2012年, Hinton教授的团队利用卷积神经网络设计了AlexNet,在ImageNet数据集上打败所有传统方法的团队,使得CNN成为计算机视觉领域中最为重要的工具。
基于深度学习的目标检测算法大致分为三类:
1、基于区域建议的算法 如,R-CNN、 Fast R-CNN、Faster R-CNN等。
2、基于目标回归的检测算法,如YOLO、SSD,retinanet,EfficientDet。
3、基于搜索的目标检测与识别算法, AttentionNet,强化学习。
4、基于Anchor-free的算法,如 CornerNet,CenterNet,FCOS 等。
网络性能比较如下:
1.R-CNN 论文地址
代码地址
主要思想:
1.输入一张图像
2.(Selective Search)选择性搜索从图像中生成2000个左右的区域建议框。
3.对于每一个区域建议框使用CNN提取特征,并组合特征。
4.使用线性SVM分类器对每个区域建议框分类
5.通过边界框回归算法重新定义目标边界框
局限性:
1.目标候选区域的重叠使CNN特征提取存在很大冗余
2.Fast R-CNN 论文地址
代码地址
主要思想:
1.生成建议窗口,Fast R-CNN用(Selective Search)方法生成建议窗口,每张图片大约2000张。
2.Fast R-CNN将建议窗口映射到CNN的最后一层卷积feature map上
2.使用Softmax预测区域类别概率
3 Smooth L1 Loss 生成边框回归
解决R-CNN问题: