tf.train.ExponentialMovingAverage

本文介绍在TensorFlow中如何使用指数移动平均(Exponential Moving Average)来提升模型验证效果。通过在训练过程中保留变量的指数衰减平均值,可以在模型验证时获得比直接使用最终训练参数更好的结果。文章详细解释了apply(), average()和average_name()方法的用途,以及它们在训练和验证过程中的具体应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://www.tensorflow.org/versions/r1.13/api_docs/python/tf/train/ExponentialMovingAverage#top_of_page

通过乘以一个指数衰减,保留变量的moving average

训练模型时,保留训练变量的moving average是有用的。平均的参数做验证的效果要优于直接用final trained的参数做的验证。

  1. apply()方法:为训练参数创建 shadow copy,并且在训练参数的shadow copy中加入moving average。apply()方法用在创建训练模型的过程中,保留moving average的操作则是在每一轮训练完成时完成。
  2. average()和average_name()方法可以得到变量的shadow copy的值以及名字。这个是用在构建验证模型的过程中,或是从checkpoint文件恢复变量的时候。可以利用这两个方法实现用shadow copy代替最终的训练值。
  3. moving average是用指数衰减计算的,shadow copy和它对应的训练变量的初始值相同,shadow copy的更新公式:\\shadow_-variable -= (1-decay)*(shadow_-variable-variable)\\ \\shadow_-variable = decay*shadow_-variable + (1-decay)*variable       decay一般是0.999,0.9999等
  4. 模型验证时:
    1. average() 方法
    2. 当利用checkpoint时,用average_name()

# moving average似乎不再需要单独加在代码中,用Adam优化器就可以达到moving average的效果

 

 

import time import tensorflow.compat.v1 as tf tf.disable_v2_behavior() from tensorflow.examples.tutorials.mnist import input_data import mnist_inference import mnist_train tf.compat.v1.reset_default_graph() EVAL_INTERVAL_SECS = 10 def evaluate(mnist): with tf.Graph().as_default() as g: #定义输入与输出的格式 x = tf.compat.v1.placeholder(tf.float32, [None, mnist_inference.INPUT_NODE], name='x-input') y_ = tf.compat.v1.placeholder(tf.float32, [None, mnist_inference.OUTPUT_NODE], name='y-input') validate_feed = {x: mnist.validation.images, y_: mnist.validation.labels} #直接调用封装好的函数来计算前向传播的结果 y = mnist_inference.inference(x, None) #计算正确率 correcgt_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) accuracy = tf.reduce_mean(tf.cast(correcgt_prediction, tf.float32)) #通过变量重命名的方式加载模型 variable_averages = tf.train.ExponentialMovingAverage(0.99) variable_to_restore = variable_averages.variables_to_restore() saver = tf.train.Saver(variable_to_restore) #每隔10秒调用一次计算正确率的过程以检测训练过程中正确率的变化 while True: with tf.compat.v1.Session() as sess: ckpt = tf.train.get_checkpoint_state(minist_train.MODEL_SAVE_PATH) if ckpt and ckpt.model_checkpoint_path: #load the model saver.restore(sess, ckpt.model_checkpoint_path) global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1] accuracy_score = sess.run(accuracy, feed_dict=validate_feed) print("After %s training steps, validation accuracy = %g" % (global_step, accuracy_score)) else: print('No checkpoint file found') return time.sleep(EVAL_INTERVAL_SECS) def main(argv=None): mnist = input_data.read_data_sets(r"D:\Anaconda123\Lib\site-packages\tensorboard\mnist", one_hot=True) evaluate(mnist) if __name__ == '__main__': tf.compat.v1.app.run()对代码进行改进
05-26
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值