ROI pooling与ROI align

本文详细介绍了深度学习中用于目标检测的两种关键方法:ROIpooling和ROIalign。ROIpooling最早由Kaiming He提出,解决了深度卷积网络输入图像需要固定大小的问题。而ROIalign则是在Mask R-CNN中提出的改进版,通过避免量化误差提高了特征对齐的准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、ROI pooling
比较早出现这个是Kaiming He的"Spatial Pyramid Pooling in Deep convolutional Networks for Visual Recognition"。之所以要提出这个东东,主要是因为深度卷积网络的输入图像需要固定的大小,这是因为要满足最后的全连接层输入需要固定长度的需求。
在这里插入图片描述
上图就是作者实现roi pooling的方法。把最后一个卷积层和全连接层之间的池化层改造成spatial pyramid pooling(SPP)层。每个spatial bin采用池化操作(文章中采用最大值池化)。SPP输出的维度是kMkMkMkkk是最后一层卷积层输出的通道数,MMM是bin的个数。这就可以固定任意大小输入图像的输出维数。roi pooling涉及到量化。
Fast rcnn中roi pooling计算方法和spp计算类似。

2、ROI align
roi align是mask r-cnn文章中提出了,在图像分割任务中,roi pooling由于量化的存在,使得特征图中点的坐标和输入图像中点的坐标不能一一对应,因此才提出roi align方法的。
方法也很简单,和roi pooling过程一样,只是没有量化,计算的浮点数的值采用双线性插值进行计算。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值