Tensorflow学习--(一个隐藏层、两个隐藏层)多层感知机实现mnist数据集

本文介绍了使用Tensorflow构建具有一个或两个隐藏层的多层感知机,并应用于MNIST数据集。在单个隐藏层的模型中,隐藏层节点数设为300,训练样本选取了3000x100个。作者进一步探讨了添加第二个隐藏层的可能性,并使用全数据集进行训练,每个epoch分为多个batch,总轮数为5。文章还解释了epoch、batch_size、batch和iteration等概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 具有一个隐藏层的多层感知机的实现是黄文坚等所著《TensorFlow实战》上的例子。隐含层的输出节点数为300(此模型中隐含层节点数设置为200-1000范围内的结果区别不大)。

训练时的数据没有使用mnist全部数据集,只使用了3000x100个样本。 

from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)
sess = tf.InteractiveSession()

in_units = 784
h1_units = 300

W1 = tf.Variable(tf.truncated_normal([in_units,h1_units],stddev=0.1))
b1 = tf.Variable(tf.zeros([h1_units]))
W2 = tf.Variable(tf.zeros([h1_units,10]))
b2 = tf.Variable(tf.zeros([10]))

x = tf.placeholder(tf.float32,[None,in_units])
#keep_prob参数为保留数据而不置为0的比例,在训练时小于1,用来制造随机性,防止过拟合
#在预测时应该等于1,即使用全部特征来预测样本的类别
keep_prob = tf.placeholder(tf.float32)

#定义算法公式
hidden1 = tf.nn.relu(tf.matmul(x,W1)+b1)
hidden1_drop = tf.nn.dropout(hidden1,keep_prob)
y = tf.nn.softmax(tf.matmul(hidden1_drop,W2) + b2)

#定义损失函数-交叉信息熵
#选择优化器
y_ = tf.placeholder(tf.float32,[None,10])
cross_entropy = tf.reduce_mean
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值