这里介绍Mask R-CNN的mask分支,mask rcnn的idea很简单,就是在faster rcnn的基础上加个mask分支(另外把ROI pooling转化成ROIAlign),所以只要理解了mask分支,大概就能理解mask rcnn了。
1. 结构:
mask分支处理ROI得到固定尺寸的14*14*80的feature map,需要注意的是target不一定都是14*14的,阅读源码之后发现对target做了resize:
2. Loss
针对每个类别,做独热编码,做binary cross-entropy loss