tensorflow初探:mlp识别mnist,准确率98%

本文探讨了使用tensorflow进行mlp识别mnist的优化过程,包括增加隐层、选择激活函数、调整参数初始化、修改损失函数和batch_size。通过这些优化,最终将准确率从91%提升至98%。实验发现,tanh激活函数和适中的batch_size(如64)有助于提高精度,而adam优化器可进一步提升模型性能。

tensorflow初探:mlp识别mnist

最近在看tensorflow学习课,课上介绍了mlp识别mnist,最终准确率为91%,老师留作业要求将结果优化到95%。主要通过以下几个方面的优化实现:

优化

  1. 增加隐层,加入激活函数
  2. 参数初始化方式,可以试试不全为0 ,发现全0全1比正态分布精度高 ,第一层w用0,其他参数用正态分布精度更高,这里有个问题,当第一层隐层的w和b都初始化为0的时候,会导致网络没法训练,准确率一直在0.13不变,第一层的w和b一直为0,不更新。
  3. 从均方误差换成交叉熵损失函数可以增加精度
  4. 更改batch_size,发现太大反而精度降低,变小反而增高一些,64时表现较好
  5. 可以修改优化器,不适用梯度下降法,使用adam或者moment(常用的优化器: tf.train.GradientDescentOptimizer、tf.train.MomentumOptimizer、tf.train.AdamOptimizer)

结果

最终,我们加入了一层100个神经元的隐层并使用tanh损失函数,修改batch_size=64,使用了交叉熵损失函数,使得准确率在20轮内提高到97%。

代码实现

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist = mnist.read_data_sets("MNIST",one_hot=True)
#每个批次大小
batch_size = 64
#计算有多少批次
n_batch = mnist.train.num_examples // batch_size
#定义占位符
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])

#定义隐层,初始化w,b,使用relu做激活函数
W_L1 = tf.Variable(tf.zeros([784,100]))
b_L1 = tf.Variable(tf.random.normal([100]))
WL1_plus_b = tf.matmul(x,W_L1) + b_L1
L1 = tf.nn.relu(WL1_plus_b)

#prediction = tf.nn.softmax(tf.matmul(x,W)+b)
W_L2 = tf.Variable(tf.random.normal([100,10]))
b_L2 = tf.Variable(tf.random.normal([10]))
WL2_plus_b = tf.matmul(L1,W_L2) + b_L2

prediction = WL2_plus_b


#定义损失函数,用交叉熵
#loss = tf.reduce_mean(tf.square(y-prediction))
loss = tf.reduce_mean(tf.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值