【计算机视觉 | 语义分割】语义分割常用数据集及其介绍（一）

最新推荐文章于 2025-04-10 10:41:40 发布

旅途中的宽~

最新推荐文章于 2025-04-10 10:41:40 发布

阅读量218

点赞数

分类专栏：计算机视觉数据集全部汇总介绍文章标签：计算机视觉人工智能语义分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wzk4869/article/details/132787983

版权

计算机视觉数据集全部汇总介绍专栏收录该内容

24 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了计算机视觉领域用于语义分割的多个数据集，包括COCO、Cityscapes、KITTI、ShapeNet等，涵盖了它们的特性、规模和应用场景。这些数据集在推动深度学习模型的发展和研究中起着至关重要的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一、COCO (Microsoft Common Objects in Context)
二、Cityscapes
三、KITTI
四、ShapeNet
五、ScanNet
六、ADE20K
七、NYUv2 (NYU-Depth V2)
八、DAVIS (Densely Annotated VIdeo Segmentation)
九、SYNTHIA (SYNTHetic Collection of Imagery and Annotations)
十、SUN RGB-D
十一、S3DIS (Stanford 3D Indoor Scene Dataset (S3DIS))
十二、GTA5 (Grand Theft Auto 5)
十三、PASCAL VOC (PASCAL Visual Object Classes Challenge)
十四、EuroSAT
十五、BDD100K

一、COCO (Microsoft Common Objects in Context)

MS COCO（Microsoft Common Objects in Context）数据集是一个大规模的对象检测、分割、关键点检测和字幕数据集。该数据集由 328K 图像组成。

分割：MS COCO 数据集的第一个版本于 2014 年发布。它包含 164K 图像，分为训练集 (83K)、验证集 (41K) 和测试集 (41K)。 2015年发布了额外的81K图像测试集，包括之前的所有测试图像和40K新图像。

根据社区反馈，2017 年训练/验证比例从 83K/41K 更改为 118K/5K。新的分割使用相同的图像和注释。 2017 年测试集是 2015 年测试集 41K 图像的子集。此外，2017 年版本还包含一个新的未注释的 123K 图像数据集。

注释：数据集有注释

对象检测：具有 80 个对象类别的边界框和每个实例分割掩模，
字幕：图像的自然语言描述（参见 MS COCO 字幕），
关键点检测：包含超过 200,000 张图像和 250,000 个用关键点标记的人物实例（17 个可能的关键点，例如左眼、鼻子、右臀部、右脚踝），
东西图像分

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

旅途中的宽~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。