来源说明
MNIST官方网站,http://yann.lecun.com/exdb/mnist/。我只是做了一个搬运工。
MNIST文件说明
MNIST一共包含了四个文件,这四个文件的定义如下表:
| 文件名 | 作用 | |
| t10k-images-idx3-ubyte | 测试集图片 | test set images |
| t10k-labels-idx1-ubyte | 测试集标签 | test set labels |
| train-images-idx3-ubyte | 训练集图片 | training set images |
| train-labels-idx1-ubyte | 训练集标签 | training set labels |
MNIST图片概述
训练集包括 60,000 个例子,测试集包括 10,000 个例子。测试集前面 5,000 个例子来自 NIST 训练集。测试集前面 5,000 个例子比后面 5,000 个例子更加简单和干净。
训练集标签文件
| 偏移量 | 数据类型 | 数值 | 描述 |
| 0000 | 32b整数 | 0x0000801(2049) | magic number (MSB first) |
| 0004 | 32b整数 | 6000 | number of items |
| 0008 | unsigned byte | ?? | label |
| 0009 | unsigned byte | ?? | label |
| xxxx | unsigned byte | ?? | label |
标签(label)取值范围为:0 ~ 9。
训练集图片文件
| 偏移量 | 数据类型 | 数值 | 描述 |
| 0000 | 32b整数 | 0x0000803(2051) | magic number |
| 0004 | 32b整数 | 6000 | number of images |
| 0008 | 32b整数 | 28 | number of rows |
| 0012 | 32b整数 | 28 | number of columns |
| 0016 | unsigned byte | ?? | pixel |
| 0017 | unsigned byte | ?? | pixel |
| xxxx | unsigned byte | ?? | pixel |
像素由智能行组成。像素的取值范围为 0 ~ 255,0 意味着背景(白色),255意味着前景(黑色)。
Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).
测试标签文件
| 偏移量 | 数据类型 | 数值 | 描述 |
| 0000 | 32b整数 | 0x0000801(2049) | magic number (MSB first) |
| 0004 | 32b整数 | 10000 | number of items |
| 0008 | unsigned byte | ?? | label |
| 0009 | unsigned byte | ?? | label |
| xxxx | unsigned byte | ?? | label |
标签(label)取值范围为:0 ~ 9。
测试集图片文件
| 偏移量 | 数据类型 | 数值 | 描述 |
| 0000 | 32b整数 | 0x0000803(2051) | magic number |
| 0004 | 32b整数 | 10000 | number of images |
| 0008 | 32b整数 | 28 | number of rows |
| 0012 | 32b整数 | 28 | number of columns |
| 0016 | unsigned byte | ?? | pixel |
| 0017 | unsigned byte | ?? | pixel |
| xxxx | unsigned byte | ?? | pixel |
像素由智能行组成。像素的取值范围为 0 ~ 255,0 意味着背景(白色),255意味着前景(黑色)。
Pixels are organized row-wise. Pixel values are 0 to 255. 0 means background (white), 255 means foreground (black).

本文详细介绍了MNIST数据集的来源、结构与格式。MNIST包含60,000个训练样本和10,000个测试样本,每个样本为28x28像素的手写数字图像。数据集分为训练集和测试集,每部分都有对应的图片和标签文件。标签范围从0到9,代表手写数字。
547

被折叠的 条评论
为什么被折叠?



