ROI Pooling

ROI Pooling是CNN目标检测中用于处理不同大小区域的关键技术,它将不同尺寸的Region Proposal转换为固定大小的feature map,提高运算效率。通过最大化池化策略,确保信息保留并加速模型运行,常用于SVM分类前的特征提取。同时,ROI Pooling解决了过多Region导致的运行速度慢和无法端到端训练的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

RCNN
ref 1

步骤:
1.使用Selective Search方法生成候选区域
2.对每一个候选区域使用CNN进行特征提取
3.对提取到的特征送入到每一类的SVM分类器 判断该区域是否属于该类特征
4.使用回归器精修候选框的位置

在这里插入图片描述

候选框搜索阶段:
使用selective search方法生成候选框,由于CNN提取特征时需要输入的大小固定 但是生成的候选框大小是不固定的因此需要对候选框进行缩放操作

  1. 直接缩放 不管图像的长宽比例(各向异性缩放)
  2. 先将boundingbox边界向外扩展延伸成正方形再进行裁剪,如果延伸出原始图像边界则用均值进行扩充如图B
  3. 先裁剪出boundingbox 再使用均值扩充生成正方形图像
    在这里插入图片描述
    对于上述三种处理方法 在原文中提出一种padding处理的方法 即先在候选框周围向外扩展16个像素值 之后再进行上述1,2,3的操作 对应上图中的第二,第四行

CNN特征提取阶段:
正负样本划分: 根据标注的boundingbox与候选框之间的IoU面积确定候选框是属于正样本还是负样本
如果不是针对特定任务进行 fine tuning那么卷积层所学到的特征就是基础的共享特征提取层,而全连接层提取到的特征是针对特定任务的特征,例如针对人脸性别分类,CNN的卷积层学习到的特征是人脸的共性特征而全连接层学习到的特征是针对性别的分类特征

SVM训练阶段:

RO

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值