计算机视觉标准,计算机视觉标准数据集整理

本文介绍了多个常用的图像数据集,包括VOC2007/2012、MNIST手写数字数据集、CIFAR-10/100及80 million tiny images等。这些数据集广泛应用于图像分类、目标检测等领域,涵盖了不同规模和难度级别的图像分类任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

此数据集能够用于图像分类,目标检测,图像分割!!!app

VOC2012: Train/Validation Data(1.9GB),Test Data(1.8GB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/网站

VOC2007: Train/Validation Data(439MB),Test Data(431MB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/spa

(用做10类图像分类)htm

包含了60,000张28x28的二值(手写数字的)训练图像,10,000张28x28的二值(手写数字的)测试图像.用做分类任务,能够分红0-9这10个类别!blog

引用:Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. "Gradient-based learning applied to document recognition." Proceedings of the IEEE, 86(11):2278-2324, November 1998.ip

(用做10类图像分类)ci

此数据集包含了60,000张32x32的RGB图像,总共有10类图像,大约6000张图像/类,50,000张作训练,10,000张作测试!get

86a2cedb063222c722b2c12bb928c09f.png

此数据集有三个版本的数据可供下载: Python版本(163MB), MATLAB版本(175MB), 二值版本(162MB)!

(用做100类图像分类)

这个数据集和CIFAR-10相比,它具备100个类,大约600张/类,每类500张训练,500张测试.这100类又能够grouped成20个大类.

此数据集也有三个版本的数据可供下载: Python版本(161MB), MATLAB版本(175MB), 二值版本(161MB)!

引用: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009

CIFAR-10和CIFAR-100都是80 million tiny images dataset的子集!

这个数据集包含了79,302,017张32x32的RGB图像,下载时包含了5个文件,网站上也提供了示例代码教你如何加载这些数据!

1. Image binary (227GB)

2. Metadata binary (57GB)

3. Gist binary (114GB)

4. Index data (7MB)

5. Matlab Tiny Images toolbox (150kB)

(用做101类图像分类)

这个数据集包含了101类的图像,每类大约有40~800张图像,大部分是50张/类,在2003年由lifeifei收集,每张图像的大小大约是300x200.

(用做256类图像分类)

此数据集和Caltech_101类似,包含了30,607张图像,数据集下载: 256_ObjectCategroies.tar(1.2GB)

IMAGENET Large Scale Visual Recognition Challenge(ILSVRC)

从2010年开始,每一年举办的ILSVRC图像分类和目标检测大赛,数据集下载: http://image-net.org/download-images

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值