Mask RCNN

最新推荐文章于 2025-03-03 17:13:06 发布

EverlightGe

最新推荐文章于 2025-03-03 17:13:06 发布

阅读量9.1k

点赞数 6

分类专栏：深度学习文章标签：深度学习目标检测实例分割

本文链接：https://blog.youkuaiyun.com/u010772289/article/details/68951625

版权

Mask R-CNN 是He Kaiming等人于2017年提出的目标检测和实例分割算法，它在Faster R-CNN基础上增加了一个mask分支，实现像素级别的目标识别。通过Region Proposal Network生成候选区域，再利用Fast R-CNN提取特征并预测类别和边界框，最后通过FCN进行像素级分割。该框架简单灵活，取得优于当时state-of-the-art的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Mask RCNN这是He Kaiming和Ross Girshick等人在2017新出的一篇文章。
一、文章思想
文章的主要思路就是把原有的Faster-RCNN进行扩展，添加一个分支，在现有的目标检测的基础上，实现对目标像素级别的识别。同时，这个网络结构比较容易实现和训练，速度5fps也算比较快点，可以很方便的应用到其他的领域，像目标检测，分割，和人物关键点检测等。并且比着现有的算法效果都要好，在后面的实验结果部分有展示出来。
二、简介
实例分割(instance segmentation)的难度在于要先对一张图片所有的目标进行正确的检测同时还要对每个示例进行分割。实际上，实例分割是目标识别(object detection)与语义分割(semantic segmentation)的一个结合。目标识别是检测出一幅图像中有什么目标，同时使用标定框(一般为一个矩形框)将目标的位置标定出来。而语义分割是将一张图像中每个像素划定到固定的类别，也就是对每个像素进行分类，在这个过程中不需要关注目标。下面这张图片能更好的理解检测和分割的区别。在同一个检测框中的目标并不属于同一个类别，可能会有不同的像素被区分出来。

这里写图片描述