Mask RCNN 标注自己的数据集,多目标如何标注

最近在尝试使用Mask RCNN训练一个工件识别的网络,但是在准备数据集遇到了问题,看了很多篇文章发现讲的都不够详细,最后本人决定实验一下,毕竟实践出真知。
在这里插入图片描述
如上图,图中有两类目标,其中一类是bolt(螺栓),另一类是nut(螺母),且两类都存在多个目标,这时候该怎么标注。
首先是第一种方法,整体划分两类,然后分别将对应的物体归到对应类中,如下图。
在这里插入图片描述

在这里插入图片描述
这种标注方式乍看之下没有问题 ,笔者最初也是采取这种方式标注的,但是训练好模型后,用图片去验证,发现整个图片中所有的螺母或者螺栓会被归为同一类。没有实现分割的效果,但是如果整个图片里只有一个螺栓和一个螺母则显示正常。
效果笔者忘记保存了,这里用画图工具简单表示一下。
我们想要的效果:
在这里插入图片描述
但是实际的效果:
在这里插入图片描述
第二种方法,将图片中的同类目标按bolt1,bolt2,nut1,nut2的方式进行命名,效果如下。
在这里插入图片描述
在这里插入图片描述
这种标注方式,最初笔者觉得有点问题,因为这样标注,像是整个数据集多出了bolt2,nut2这些类一样,不知道在NUM_CLASSES 和class_names这些需要表出类的地方填什么合适。
但是测试发现NUM_CLASSES = 1+2 ;class_names =[‘BG’, ‘nut’,‘blot’]采用第二种方式就可以得到我们想要的结果。
具体原理咱也不懂,如果有大佬看到希望可以解惑,感激不尽。

### 已标注Mask R-CNN数据集下载 对于希望使用已标注好并适合于Mask R-CNN训练或测试的数据集,多个公开资源可供选择。这些数据集不仅提供了丰富的图像样本,还包含了详细的像素级掩膜标注,非常适合进行实例分割任务的研究。 #### COCO数据集 COCO (Common Objects in Context) 是最常用的一个大型综合数据集之一,其涵盖了80种不同类型的物体类别,并为每张图片中的目标提供精确的边界框以及逐像素级别的语义和实例分割标签[^2]。该数据集广泛应用于评估各种视觉识别算法性能,包括但不限于Mask R-CNN模型。访问官方网站即可获取最新版本的数据文件。 #### Pascal VOC数据集 Pascal Visual Object Classes Challenge (VOC) 提供了一个结构化良好的平台来评测计算机视觉系统的性能。尽管相比COCO规模较小,但依然具有较高的质量标准。此挑战赛所使用的数据集中也存在部分经过人工精心标记的对象区域信息,可用于简单的实例分割实验[^1]。 #### AI Challenger Keypoint数据集 AI Challenger姿态估计竞赛所提供的关键点检测数据集同样适合作为Mask R-CNN输入的一部分。除了常规的目标定位外,这里特别强调对人体关节位置进行了细致入微地描绘,能够帮助改进人体部位解析能力[^3]。 为了方便用户快速开始项目开发,在线社区和技术论坛经常分享一些预处理过的数据包链接;另外GitHub平台上也有许多开源仓库整理好了可以直接拿来即用的小型验证集合。不过需要注意的是,在实际操作过程中应当遵循各站点版权说明及相关法律法规的要求合法合规地利用上述资料。 ```bash # 下载COCO数据集示例命令 wget http://images.cocodataset.org/zips/train2017.zip unzip train2017.zip -d ./data/coco/ ```
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值