ROI Pooling 与 ROI Align
假设原图尺寸大小为256×256,预测ROI的坐标为(6.4, 12.8, 153.6, 172.8),特征图大小为8×8。现在要将ROI池化成3×3大小。我们来对比一下Roi pooling 和 ROI Align的区别。
将ROI区域映射到特征图上
对于ROI pooling而言,计算出来的坐标要取整,结果为(1,1,4,5),此处进行了第一次量化;而ROI Align直接将坐标值除以32即可,结果为(0.2, 0.4, 4.8, 5.4)。
圆圈代表像素点,橙色框是ROI映射到特征图上的范围。
划分池化区域
ROI pooling在划分池化区域的时候,由于roi的大小无法被池化尺寸整除,因此出现不同的池化范围(此处进行了第二次量化)。ROI Align在进行池化区域划分的时候,不进行量化处理。
红色线代表池化范围界限
池化值的计算
计算最大池化时,对于ROI Pooling,直接选出池化范围内的最大值即可,上图打蓝色勾勾的像素,池化结果如下图所示: