机器学习笔记 - 使用Mask-Rcnn训练自定义数据集

本文介绍了使用Mask R-CNN进行实例分割的背景,详细阐述了从R-CNN到Mask R-CNN的演进过程。文章重点讨论了在Python 3.7.9和TensorFlow-GPU 2.4.1环境下,如何准备数据集(包括35张标注脸部的图片),配置代码,以及训练和测试模型的过程。在训练过程中遇到的问题,如tensorflow版本问题导致的“Could not load dynamic library 'cupti64_110.dll'”错误,以及由于GPU资源限制导致的OOM问题,也进行了分享。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Mask R-CNN

         用于实例分割的Mask R-CNN模型已经从之前的三种对象检测架构演变而来:

        R-CNN:将输入图像呈现给网络,在图像上运行选择性搜索,然后使用预训练的 CNN 将选择性搜索的输出区域用于特征提取和分类。

        Fast R-CNN:仍然使用Selective Search算法来获取region proposal,但是增加了Region of Interest (ROI) Pooling模块。从特征图中提取一个固定大小的窗口,并使用这些特征来获得最终的类标签和边界框。好处是网络现在是端到端可训练的。

        Faster R-CNN:引入区域提议网络 (RPN),将区域提议直接烘焙到架构中,从而减轻对选择性搜索算法的需求。

Mask R-CNN 架构。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值