MNIST数据集
MNIST是一个手写体数字识别数据体,作为机器学习的入门样例。这个数据集包含了60000张图片作为训练数据,其中图片的大小为28*28。一般从中划出5000张作为验证数据(validation),另外55000张作为训练数据(train),还有10000张图片作为测试数据(test),且每一张图片都代表了0-9中的一个数字。在TF中专门提供了一个类来处理MNIST数据:
from tensorflow.examples.tutorials.mnist import input_data
#载入MNIST数据集,如果MNIST_data文件夹中无数据,则自动从网上下载
mnist = input_data.read_data_sets("MNIST_data", one_hot=True)
print("Training data size:", mnist.train.num_examples)
#Training data size: 55000
print("Validating data size:", mnist.validation.num_examples)
#Validating data size: 5000
print("Testing data size:", mnist.test.num_examples)
#Testing data size: 10000
print("Example training data:", mnist.train.images[0])
#Example training data:[0. 0. 0. 0. 0. ... 0. 0.365 0. ...] 共784项
print("Example training data label:", mnist.train.labels[0])
#打印数据的答案
#Example training data label:[0 0 0 0 0 0 0 0 0 0 0 1 0] 共10项,第几项为1就代表数字几
input_data.read_data_sets函数生成的类还提供了mni