分类和定位、语义分割、目标检测

博客介绍了目标检测与语义分割、分类定位的区别,重点阐述了R-CNN算法在目标检测中的应用。包括生成约2000个category-independent region proposals,将每个region proposal调整大小并归一化后作为CNN输入提取特征向量,最后用SVM分类器判断类别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 语义分割是对输入图像的每个像素做分类,不区分同类目标;
  • 而目标检测需要对输入图像出现的对象进行定位并预测该对象所属类别;
  • 分类和定位是一张图像中的信息做分类,并且在已知对象数目的情况下进行定位(注意目标检测并不知道每张图像中对象的数量。)

目标检测

在这里插入图片描述

R-CNN

在这里插入图片描述
给定输入图像,采用R-CNN完成目标定位:

  1. Region proposals:生成 category-independent region proposals (约2000个);
  2. Feature extraction:将每个region proposal 分别 resize 到 227×227 作为 CNN 网络的输入,然后利用 CNN 为每个 region proposal 提取固定大小特征向量;
  3. Classification:将提取的特征送入每一类的SVM分类器,判断是否属于该类。

在这里插入图片描述

Region proposals: selective search

R-CNN 采用 s e l e c t i v e   s e a r c h [ 3 ] selective \ search^{[3]} selective search[3]生成category-independent region proposals。

Feature extraction

R-CNN 为每个region proposal 提取一个4096维的特征向量。
CNN输入数据预处理:首先将每个region proposal 分别 resize 到 227×227 的RGB图像(采用warp),然后进行归一化(即每个维度减去均值)并作为CNN的输入。

Features are computed by forward propagating a mean-subtracted 227×227 RGB image through five convolutional layers and two fully connected layers.

Classification

R-CNN 采用SVM对提取的特征向量进行打分。
在这里插入图片描述

参考资料:
[1] [深度学习]语义分割、分类定位与目标检测
[2] 从RCNN到Faster RCNN
[3] J. Uijlings, K. van de Sande, T. Gevers, and A. Smeulders. Selective search for object recognition. IJCV, 2013. 1, 2, 3, 4, 5, 9
[4] 基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值