Mask_RCNN分割测试

最新推荐文章于 2025-06-19 11:58:27 发布

xiao__run

最新推荐文章于 2025-06-19 11:58:27 发布

阅读量5.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： python-opencv linux操作系统图像处理机器学习

本文链接：https://blog.youkuaiyun.com/xiao__run/article/details/81284094

图像处理同时被 3 个专栏收录

65 篇文章 ¥9.90 ¥99.00

订阅专栏

python-opencv

57 篇文章 ¥19.90 ¥99.00

订阅专栏

机器学习

33 篇文章 ¥29.90 ¥99.00

订阅专栏

本文介绍了目标检测的重要性，传统方法的局限性，以及基于深度学习的Mask RCNN模型，该模型在COCO挑战赛中夺冠。文章详细阐述了Mask RCNN的结构和应用，包括环境配置、预训练模型使用、数据集的labelme工具标注，以及转换和训练过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目标检测是计算机视觉和模式识别的重要研究方向，主要是确定图像中是否有感兴趣的目标存在，并对其进行探测和精确定位。传统的目标检测流程采用滑动窗口进行区域选择，然后采用 SIFT、HOG 等方法进行特征提取，最后采用 SVM、Adaboost 进行类别判断。但是传统的目标检测方法面临的主要问题有：特征提取鲁棒性差，不能反应光照变化、背景多样等情况；区域选择没有针对性，时间复杂度高，窗口冗余。基于深度学习的目标检测模型有 Faster RCNN，Yolo 和 Yolo2，SSD 等，对图片中的物体进行目标检测的应用示例如下所示：
这里写图片描述
从上图中可以看出，目标检测主要指检测一张图像中有什么目标，并使用方框表示出来；而实体分割要标出每个像素所属的类别。下图的实体分割，不仅把每个物体的方框标注出来，并且把每个方框中像素所属的类别也标记出来。下图中每个方框中包含的信息有目标所属类别，置信概率以及方框中每个像素的类别。
这里写图片描述
Kaiming He 等于 2017 年提出 Mask RCNN 网络结构，该网络结构主要用于目标检测和实体分割，并且赢得了 COCO 2016 挑战赛的冠军。该文章的主要思想是把 Faster RCNN 目标检测框架进行扩展，添加一个 Mask 分支用于检测目标框中每个像素的类别，如上图