第9章 TensorFlow在MNIST中的应用
MNIST[1](Mixed National Institute of Standards and Technology)是一个入门级的计算机视觉数据集,数据集中都是美国中学生手写的数字。它的训练集包含6万张图片,测试集包含1万张图片,并且数字已经进行过预处理和格式化,做了大小调整并居中,图片尺寸也固定为28×28。这个数据集很小,但训练速度很快,而且收敛效果也很好,非常适合作为实战的例子去学习。
接下来我们就以MNIST数据集为例,尝尽TensorFlow在深度学习中的各种应用。
9.1 MNIST数据集简介
MNIST数据集是NIST数据集的子集,包含以下4个文件。
- train-labels-idx1-ubyte.gz:训练集标记文件(28 881字节)。
- train-images-idx3-ubyte.gz:训练集图片文件(9 912 422 字节)。
- t10k-labels-idx1-ubyte.gz:测试集标记文件(4 542字节)。
- t10k-images-idx3-ubyte.gz:测试集图片文件(1 648 877字节)。
MNIST数据集包括训练集的图片和标记数据,以及测试集的图片和标记数据,在测试集包含的10 000个样例中,前5 000个样例取自原始的NIST训练集,后5 000个取自原始的NIST测试集,因此前5 000个预测起来更容易些。
下面具体讲解它们的格式
订阅专栏 解锁全文
793

被折叠的 条评论
为什么被折叠?



