Tensor Mask
文章
何恺明还有RBG大神的新作(一作陈鑫磊这个名字也很熟悉啊)。之前在instance segmentation方面只看过mask R-CNN的论文,看到这篇文章是dense object segmentation,由于在做one-stage detector方面的工作,所以想看看这篇论文能不能对自己有什么启发。
文章的motivation在于:object detection中有dense的方法(如yolo,ssd,retinanet),也有R-CNN这类two-stage的方法;然而在instance segmentation中,目前却没有dense方面的工作,本文的目的就是要用dense的方法来做一下instance segmentation,希望能促进这方面的研究。我对dense object detection的理解就是,直接通过一个end-to-end的网络得到一个HxWxC的输出,这个输出就代表了原图的HxW个位置上的检测结果(但是一个位置上可能又有多个结果,比如yolo一个位置有9个anchor对应9个结果),dense detection比较好做的原因之一就是,bounding box只需要4个变量就可以表示,然而instance segmentation的mask就没那么简单了,因此本文要解决的第一个问题就是,怎么利用CNN的输出tensor来表示dense的segmentation结果,本文提出用一个4D的tensor来表示。
本文4D的tensor形状具体为&