Mask RCNN这是He Kaiming和Ross Girshick等人在2017新出的一篇文章。
一、文章思想
文章的主要思路就是把原有的Faster-RCNN进行扩展,添加一个分支,在现有的目标检测的基础上,实现对目标像素级别的识别。同时,这个网络结构比较容易实现和训练,速度5fps也算比较快点,可以很方便的应用到其他的领域,像目标检测,分割,和人物关键点检测等。并且比着现有的算法效果都要好,在后面的实验结果部分有展示出来。
二、简介
实例分割(instance segmentation)的难度在于要先对一张图片所有的目标进行正确的检测同时还要对每个示例进行分割。实际上,实例分割是目标识别(object detection)与语义分割(semantic segmentation)的一个结合。目标识别是检测出一幅图像中有什么目标,同时使用标定框(一般为一个矩形框)将目标的位置标定出来。而语义分割是将一张图像中每个像素划定到固定的类别,也就是对每个像素进行分类,在这个过程中不需要关注目标。下面这张图片能更好的理解检测和分割的区别。在同一个检测框中的目标并不属于同一个类别,可能会有不同的像素被区分出来。
Mask RCNN
最新推荐文章于 2025-03-03 17:13:06 发布