【计算机视觉 | 语义分割】语义分割常用数据集及其介绍(一)

本文详细介绍了计算机视觉领域用于语义分割的多个数据集,包括COCO、Cityscapes、KITTI、ShapeNet等,涵盖了它们的特性、规模和应用场景。这些数据集在推动深度学习模型的发展和研究中起着至关重要的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、COCO (Microsoft Common Objects in Context)

MS COCO(Microsoft Common Objects in Context)数据集是一个大规模的对象检测、分割、关键点检测和字幕数据集。 该数据集由 328K 图像组成。

分割:MS COCO 数据集的第一个版本于 2014 年发布。它包含 164K 图像,分为训练集 (83K)、验证集 (41K) 和测试集 (41K)。 2015年发布了额外的81K图像测试集,包括之前的所有测试图像和40K新图像。

根据社区反馈,2017 年训练/验证比例从 83K/41K 更改为 118K/5K。 新的分割使用相同的图像和注释。 2017 年测试集是 2015 年测试集 41K 图像的子集。 此外,2017 年版本还包含一个新的未注释的 123K 图像数据集。

注释:数据集有注释

对象检测:具有 80 个对象类别的边界框和每个实例分割掩模,
字幕:图像的自然语言描述(参见 MS COCO 字幕),
关键点检测:包含超过 200,000 张图像和 250,000 个用关键点标记的人物实例(17 个可能的关键点,例如左眼、鼻子、右臀部、右脚踝),
东西图像分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值