Daily 学习笔记(三)

1.ROI Pooling

https://blog.youkuaiyun.com/auto1993/article/details/78514071

1⃣️ROI:

          regions of interest

2⃣️目标检测的典型框架结构:

          region proposal+classifition+regression

         缺点:proposal阶段计算量大,速度慢;不是end-to-end training

3⃣️使用ROI Pooling的好处

          加速training和testing过程;提高accuracy

4⃣️ROI Pooling 操作

        输入:卷积层输出的feature maps   +

                   region proposal方法(如RPN)提出的候选框(或者说ROI)(每个用5个值表示,index,坐标,长宽?

(1)根据输入image,将ROI映射到feature map对应位置;

(2)将映射后的区域划分为相同大小(细节问题:无法恰好分好,舍弃还是重叠?)的sections(sections数量与输出的维度相同);怎么划分取决于输出维度

(3)对每个sections进行max pooling操作;

ROI pooling总结:

(1)用于目标检测任务;(2)允许我们对CNN中的feature map进行reuse;(3)可以显著加速training和testing速度;(4)允许end-to-end的形式训练目标检测系统。

在pytorch中的使用:

  1. torch.nn.functional.adaptive_max_pool2d(input, output_size, return_indices=False)
  2. torch.nn.AdaptiveMaxPool2d(output_size, return_indices=False)
  3. torchvision.ops.roi_pool(inputboxesoutput_sizespatial_scale=1.0)                                                                  Performs Region of Interest (RoI) Pool operator described in Fast R-CNN

2.ROI Pooling的反向传播https://zhuanlan.zhihu.com/p/59692298

preview

两次量化过程:

  1. (1)、在原图上生成的region proposal 映射到feature map需要除以16或者32的时候,边界出现小数,这是第一次量化。

    (2)、在每个roi里划分成k×k(7×7)的bins,对每个bin中均匀选取多少个采样点,然后进行max pooling,也会出现小数,这是第二次量化。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值