前言
🌺什么是目标检测呢?
目标检测(objection detection)是计算机视觉(cv)的一个分支,在图像分类任务中,我们往往假设图像中只有一个主题目标,这时我们关注的是如何识别这个目标的类别,然而很多时候,一张图像中会有多个我们感兴趣的目标,我们想同时知道这些目标的类别以及他们所在的位置,在cv中,我们将这类任务称为目标检测或者物体检测
1、two stage算法
two stage检测算法先由算法生成一系列候选框,然后再通过卷积神经网络对候选区域进行分类,相比于one stage算法在检测准确率和定位精度上占优势
R -CNN
论文 Rich feature hierarchies for accurate object detection and semantic segmentation的发表是CNN进入目标检测的里程碑
从图中可以看出,R-CNN将检测抽象为两个过程,一是基于图片提取出若干可能包含物体的区域(即图片的局部裁剪,被称为Region Proposal),文中使用的是Selective Search算法;二是在提出的这些区域上运行当时表现最好的分类网络(AlexNet),从而得到每个区域内物体的类别