MNIST入门

最新推荐文章于 2024-10-20 15:56:22 发布

hopyGreat

最新推荐文章于 2024-10-20 15:56:22 发布

阅读量342

点赞数

CC 4.0 BY-SA版权

分类专栏： python tensorflow

本文链接：https://blog.youkuaiyun.com/hopyGreat/article/details/80584268

python 同时被 2 个专栏收录

41 篇文章

订阅专栏

tensorflow

14 篇文章

订阅专栏

这里倒是没有讲MNIST数据集的概念，具体可以参见这篇文章：MNIST机器学习入门

这里只是将文中所述的预测代码简单实现了下：

import tensorflow as tf
import numpy as np

from tensorflow.examples.tutorials.mnist import input_data

# 下载数据
mnist = input_data.read_data_sets("/tmp/data", one_hot=True)

# 每张图片都是 28*28 的像素点图 展开成一个向量 长度就是784
# 输入数据为 [None, 784] 这里的None表示此张量的第一个维度可以是任意长度的
x = tf.placeholder(tf.float32, [None, 784], name='input')
# 输出是一个长度为10的向量 只有一位为1 其它位为0 为1的那一位表示这张图代表的是数字几
y_ = tf.placeholder(tf.float32, [None, 10], name='output')

# 只有一层中间层 值采用正态分布
weight = tf.Variable(tf.truncated_normal([784, 10], stddev=0.1))
# 偏置项  初值全为0
biases = tf.Variable(tf.zeros([10]))

# 使用 sotfmax回归将前向传播的结果变成概率分布
y = tf.nn.softmax(tf.matmul(x, weight) + biases)

# 交叉熵 计算预测的概率分布与真实答案的概率分布的距离
# 使用交叉熵 定义loss损失 
cross_entropy = -tf.reduce_sum(y_ * tf.log(y))
# 使用随机梯度下降进行反向传播优化参数
# GradientDescentOptimizer为梯度下降 训练时的参数为随机一部分 而不是全部 故为随机梯度下降
# 采用全部参数 会导致 训练过程很慢 但能保证一定是全局最优解
# 随机优化某一条训练数据 会加大训练速度 但得到的解甚至可能无法达到局部最优
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

with tf.Session() as sess:
        # 初始化所有变量
        init = tf.initialize_all_variables()
        sess.run(init)

        # 训练1000次
        for i in range(1000):
                # 每次随机抓取100个批处理数据点
                batch_xs, batch_ys = mnist.train.next_batch(100)
                # 喂入输入 进行训练参数
                sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

                # 预测结果与真实信息匹配程度
                # 运行结果为一组布尔值 
                correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_, 1))
                # 对平均值进行训练优化参数
                accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

        # 打印最终的预测正确率
        print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_: mnist.test.labels}))