【深度学习小知识】ROI到ROI pooling 再到ROI Align

ROI(感兴趣区域)在计算机视觉中用于定位图像中的物体。RoIPooling是深度学习中处理ROI的常用方法,它通过固定尺寸的池化层对特征图进行处理。然而,RoIPooling存在取整误差,ROIAlign引入了亚像素精度的插值来解决这一问题,提高定位准确性。ROIAlign通过线性插值确保每个池化单元的精确采样,从而提供更精确的特征表示。

ROI详解

Region of interest(ROI),中文译为感兴趣区域。在计算机视觉领域,从输入的图像中框选处理待处理的区域就是ROI。
ROI / Region proposals大致过程

  • 输入一张图片
  • 在图片中找到物体/目标(objects)的所有位置
  • 输出/获得这些一系列的objects的bounding box.
    在这里插入图片描述
    在这里插入图片描述

RoI Pooling详解

Pooling操作

在了解ROI pooling前,先了解一下pooling操作
以2x2的maxpooling为例,能够在2x2大小中选取一个最大值。
如下图所示4x4的矩阵,变为了2x2的矩阵。
在这里插入图片描述

ROI pooling

Roi pooling的操作流程:

  1. 输入图像后经过特征提取,得到特征图(Feature Map)。
  2. RoI区域映射到特征图上(映射:与ROI在原图上的位置相对应)。
  3. 将映射后的区域划分成多个部分部分的数目的输出的维度有关。
  4. 对每个部分进行pooling(max pooling)操作。

下面是一个图像的特征图,使用0.88、0.44等构成的8x8矩阵进行表示,需要输出2x2大小的矩阵。
在这里插入图片描述
图中红框表示ROI在Feature map 上的映射区域,(1,2)和(7,7)分别表示映射区域的左上角及右下角坐标。
(怎么映射?特征图和原图存在一定的大小比例,按照比例对原图上的ROI区域进行调整,就能够得到红色区域)
在这里插入图片描述
现在要输出2x2的矩阵,所以要将ROI映射区域划分为四个部分(现在ROI区域是5 x 6 大小)。
划分过程如下:

  • 5/2 =2.5,即将5行划分为 2 + 3 行两部分
  • 6/2 = 3,即将6列平均划分为 3+3列两部分
    在这里插入图片描述
  • 当然,现在我们不用 2 X 2 大小的maxpooling进行池化,大小不够。
  • 而使用 2 X 3 和3 X 3的maxpooling对四个区域进行池化操作。
  • 最终得到2 X 2d的所需结果。
    在这里插入图片描述
    以上就是ROI pooling的操作

ROI Align详解

ROI Align是对ROI pooling中取整操作,造成的偏差的改进。

ROI pooling的取整操作:

  • ROI映射到feature map上,比例进行变化。但是这个比例变换不一定整数倍的变换,存在小数是就会取整操作
  • ROI 映射到特征层后,按照输出维度划分ROI映射区域时,划分的区域不一定是刚好划分平均(5/2 = 2.5, 所以分为2 + 3)。

主要是使用线性插值的方法,我自己只能理解,所以推荐下下面的链接。当然也可以多在网上查一查相关资料。
这是对于ROI Align的详解

编号 文件名称 cwts-specs-001 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:名语术语 cwts-specs-002 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:概述 cwts-specs-003 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:物理信道和传输信道到物理信道的映射 cwts-specs-004 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:信道编码与复用 cwts-specs-005 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:扩频与调制 cwts-specs-006 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:物理层过程 cwts-specs-007 IMT-DS FDD(WCDMA)系统无线接口物理层技术规范:物理层测量 cwts-specs-008 IMT-DS FDD(WCDMA)系统无线接口层2技术规范:物理层向上层提供的服务 cwts-specs-009 IMT-DS FDD(WCDMA)系统无线接口层2技术规范:MAC协议 cwts-specs-010 IMT-DS FDD(WCDMA)系统无线接口层2技术规范:RLC协议 cwts-specs-011 IMT-DS FDD(WCDMA)系统无线接口层2技术规范:PDCP协议 cwts-specs-012 IMT-DS FDD(WCDMA)系统无线接口层2技术规范:BMC协议 cwts-specs-013 IMT-DS FDD(WCDMA)系统无线接口层3技术规范:RRC协议 cwts-specs-014 IMT-DS FDD(WCDMA)系统Iu接口技术规范:概述 cwts-specs-015 IMT-DS FDD(WCDMA)系统Iu接口技术规范:层1技术要求 cwts-specs-016 IMT-DS FDD(WCDMA)系统Iu接口技术规范:信令传输 cwts-specs-017 IMT-DS FDD(WCDMA)系统Iu接口技术规范:RANAP信令 cwts-specs-018 IMT-DS FDD(WCDMA)系统Iu接口技术规范:数据传输和传输信令 cwts-specs-019 IMT-DS FDD(WCDMA)系统Iu接口技术规范:用户平面协议 cwts-specs-020 IMT-DS FDD(WCDMA)系统Iub接口技术规范:概述 cwts-specs-021 IMT-DS FDD(WCDMA)系统Iub接口技术规范:层1技术要求 cwts-specs-022 IMT-DS FDD(WCDMA)系统Iub接口技术规范:信令传输 cwts-specs-023 IMT-DS FDD(WCDMA)系统Iub接口技术规范:NBAP信令 cwts-specs-024 IMT-DS FDD(WCDMA)系统Iub接口技术规范:用于CCH数据流的数据传输和传输信令 cwts-specs-025 IMT-DS FDD(WCDMA)系统Iub接口技术规范:用于CCH数据流的用户平面协议 cwts-specs-026 IMT-DS FDD(WCDMA)系统Iur接口技术规范:概述 cwts-specs-027 IMT-DS FDD(WCDMA)系统Iur接口技术规范:层1技术要求 cwts-specs-028 IMT-DS FDD(WCDMA)系统Iur接口技术规范:信令传输 cwts-specs-029 IMT-DS FDD(WCDMA)系统Iur接口技术规范:RNSAP信令 cwts-specs-030 IMT-DS FDD(WCDMA)系统Iur接口技术规范:用于CCH数据流的数据传输和传输信令 cwts-specs-031 IMT-DS FDD(WCDMA)系统Iur接口技术规范:用于CCH数据流的用户平面协议 cwts-specs-032 IMT-DS FDD(WCDMA)系统Iub/Iur接口技术规范:用于DCH数据流的数据传输和传输信令 cwts-specs-033 IMT-DS FDD(WCDMA)系统Iub/Iur接口技术规范:用于DCH数据流的用户平面协议 cwts-specs-034 TD-SCDMA系统无线接口物理层技术规范 cwts-specs-035 TD-SCDMA系统无线接口层2技术规范 cwts-specs-036 TD-SCDMA系统无线接口层3-RRC技术规范 cwts-specs-037 TD-SCDMA系统Iu接口技术规范 cwts-specs-038 TD-SCDMA系统Iub接口技术规范 cwts-specs-039 TD-SCDMA系统Iur接口技术规范 cwts-specs-040 TD-SCDMA系统基站设备无线收发特性技术规范 cwts-specs-041 TD-SCDMA系统用户终端设备无线收发特性技术规范 CWTS发布的研究报告列表 cwts-reports-001 IMT-DS FDD(WCDMA)系统连接模式下的层间过程(25.303)标准研究报告 cwts-reports-002 IMT-DS FDD(WCDMA)系统空闲模式下UE的流程和连接模式下小区重选流程(25.304)标准研究报告 cwts-reports-003 IMT-DS FDD(WCDMA)系统无线资源管理RRM研究报告 cwts-reports-004 IMT-DS FDD(WCDMA)系统无线资源管理RRM研究报告 cwts-reports-005 IMT-DS FDD(WCDMA)系统UE无线接入能力研究报告
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值