这里倒是没有讲MNIST数据集的概念,具体可以参见这篇文章:MNIST机器学习入门
这里只是将文中所述的预测代码简单实现了下:
import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data
# 下载数据
mnist = input_data.read_data_sets("/tmp/data", one_hot=True)
# 每张图片都是 28*28 的像素点图 展开成一个向量 长度就是784
# 输入数据为 [None, 784] 这里的None表示此张量的第一个维度可以是任意长度的
x = tf.placeholder(tf.float32, [None, 784], name='input')
# 输出是一个长度为10的向量 只有一位为1 其它位为0 为1的那一位表示这张图代表的是数字几
y_ = tf.placeholder(tf.float32, [None, 10], name='output')
# 只有一层中间层 值采用正态分布
weight = tf.Variable(tf.truncated_normal([784, 10], stddev=0.1))
# 偏置项 初值全为0
biases = tf.Variable(tf.zeros([10]))
# 使用 sotfmax回归将前向传播的结果变成概率分布
y = tf.nn.softmax(tf.matmul(x, weight) + biases)
# 交叉熵 计算预测的概率分布与真实答案的概率分布的距离
# 使用交叉熵 定义loss损失
cross_entropy = -tf.reduce_sum(y_ * tf.log(y))
# 使用随机梯度下降进行反向传播优化参数
# GradientDescentOptimizer为梯度下降 训练时的参数为随机一部分 而不是全部 故为随机梯度下降
# 采用全部参数 会导致 训练过程很慢 但能保证一定是全局最优解
# 随机优化某一条训练数据 会加大训练速度 但得到的解甚至可能无法达到局部最优
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)
with tf.Session() as sess:
# 初始化所有变量
init = tf.initialize_all_variables()
sess.run(init)
# 训练1000次
for i in range(1000):
# 每次随机抓取100个批处理数据点
batch_xs, batch_ys = mnist.train.next_batch(100)
# 喂入输入 进行训练参数
sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
# 预测结果与真实信息匹配程度
# 运行结果为一组布尔值
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_, 1))
# 对平均值进行训练优化参数
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
# 打印最终的预测正确率
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))