论文阅读《PolarMask: Single Shot Instance Segmentation with Polar Representation》

论文链接:https://arxiv.org/pdf/1909.13226.pdf

PolarMask是发表在CVPR20上的一篇文章,基于FCOS,把实例分割统一到了FCN的框架下。与Mask RCNN不同,PolarMask是通过寻找物体的counter进行建模,以得到实例的mask,如下图所示:
在这里插入图片描述
上图(a)为原图像;(b)为Mask RCNN一类的分割方法,在bbox中对每一个pixel进行分类;(c)为直角坐标系下的counter建模;(d)为极坐标系建模轮廓(即本文PolarMask的建模方式)。

其实(c)图直角坐标系的建模方式也是可行的,但是图(d)更加简单,因为极坐标系相较于直角坐标系拥有固定角度先验,因此模型在做回归的时候只需要回归特定角度下的距离即可,大大简化了问题的求解难度。这样实例分割问题就转化成了两个部分:即对实例的中心点进行分类,以及在极坐标系下的密集距离回归。整个pipeline以一张image作为输入,经过模型后得到实例中心点的类别,以及在各个方向上面的距离,最后将这些距离进行组装,得到最后的分割mask。

所以整个流程和FCOS一样简单,而且可以看作FCOS的拓展。因为FCOS只需要预测检测框,从而只需要预测四个方向的参数即可(l,r,t,b)——0,90,180,270度四个方向。PolarMask预测了36个角度的距离,从而得到实例的counter。因此FCOS属于PolarMask的一种特殊情况,也证明了实例分割的复杂性和目标检测相仿,并没有增加太多复杂度。

Architecture

PolarMask的网络结构如下图所示:
在这里插入图片描述
整体结构与FCOS

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值