R-CNN（Rich feature hierarchies for accurate object detection and semantic segmentation）

最新推荐文章于 2024-04-26 21:45:01 发布

原创

最新推荐文章于 2024-04-26 21:45:01 发布 · 469 阅读

2 ·

CC 4.0 BY-SA版权

R-CNN是一种基于CNN的目标检测算法，通过使用CNN特征提取和SVM分类器显著提高了VOC2012数据集上的mAP。算法包括候选区域提取、特征提取、分类和边界框回归四个步骤。预训练的CNN用于处理候选区域，以解决数据稀疏问题。测试时采用非极大抑制策略，训练时采用hard negative mining增强分类器性能。附加部分探讨了不同图像变换对结果的影响，以及正负样本的选择对SVM和Softmax的不同影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Abstract

以往的目标检测算法不仅效果不好而且原理复杂，RCNN是一种简单并且可扩展的算法，在VOC2012数据集上mean average precision (mAP)提高了30%。RCNN主要使用了两个方法：（1）使用CNN代替传统的特征提取方法来对候选区进行定位和分割（2）对于目标检测任务来说数据量是稀少的，所以采用了预训练CNN的策略。

Introduction

特征问题，最初是利用SIFT和HOG并利用复杂的ensemble系统的方法，后来由于基于生物上的视觉处理过程，由SIFT引入CNN，以及近些年CNN以成为主流算法（所以我得找个时间把上面得传统特征提取算法原理过一遍~）。由于近些年CNN在图像分类任务上表现优异，本文作者就试图把图像分类任务扩展到目标探测上来，实验表明利用CNN得优势相比传统算法，在目标探测算法上取得了更好得效果。

定位问题和图像分类是不同的，其中，定位问题的一种解决办法是被视为回归问题，然而当时！这种方法取得效果并不好，另一种方法是利用滑窗的思想；相反，RCNN原理是对候选区进行识别。算法流程如下：