Mask R-CNN 是一种经典的实例分割(Instance Segmentation)算法,由 Facebook AI Research (FAIR) 团队于 2017 年提出。它扩展自 Faster R-CNN,不仅能够完成目标检测(检测物体并给出边界框),还能为每个检测到的物体生成精确的像素级分割掩码(Mask)。
1. Mask R-CNN 的核心思想
Mask R-CNN 在 Faster R-CNN 的基础上增加了一个并行分支,用于预测每个目标的分割掩码(Mask),从而实现:
-
目标检测(Bounding Box + 类别)
-
实例分割(Pixel-wise Mask)
主要改进
-
RoIAlign(取代 RoIPool):
-
解决 RoIPool 的量化误差问题,使特征映射更精确对齐原图。
-
采用双线性插值计算浮点数坐标,提升小目标分割精度。
-
-
Mask 分支:
-
在原有的分类(Class)和回归(Box)分支基础上,新增一个全卷积网络(FCN)生成每个 RoI 的分割掩码。
-
Mask 分支独立于分类,避免类别竞争,提升分割质量。
-
2. Mask R-CNN 的网络结构
Mask R-CNN

最低0.47元/天 解锁文章
2542

被折叠的 条评论
为什么被折叠?



