Tensorflow系列——Saver的用法

本文详细介绍了 TensorFlow 中 Saver 类的使用方法,包括如何在训练过程中保存模型参数以及如何在测试阶段恢复这些参数。通过一个具体的示例,展示了 Saver 类如何帮助管理 Checkpoints 文件,确保模型训练结果得以保存并可用于后续的测试或继续训练。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Saver的用法

1. Saver的背景介绍

    我们经常在训练完一个模型之后希望保存训练的结果,这些结果指的是模型的参数,以便下次迭代的训练或者用作测试。Tensorflow针对这一需求提供了Saver类。

  1. Saver类提供了向checkpoints文件保存和从checkpoints文件中恢复变量的相关方法。Checkpoints文件是一个二进制文件,它把变量名映射到对应的tensor值 。
  2. 只要提供一个计数器,当计数器触发时,Saver类可以自动的生成checkpoint文件。这让我们可以在训练过程中保存多个中间结果。例如,我们可以保存每一步训练的结果。
  3. 为了避免填满整个磁盘,Saver可以自动的管理Checkpoints文件。例如,我们可以指定保存最近的N个Checkpoints文件。

2. Saver的实例

下面以一个例子来讲述如何使用Saver类

 
  1. import tensorflow as tf

  2. import numpy as np

  3. x = tf.placeholder(tf.float32, shape=[None, 1])

  4. y = 4 * x + 4

  5. w = tf.Variable(tf.random_normal([1], -1, 1))

  6. b = tf.Variable(tf.zeros([1]))

  7. y_predict = w * x + b

  8. loss = tf.reduce_mean(tf.square(y - y_predict))

  9. optimizer = tf.train.GradientDescentOptimizer(0.5)

  10. train = optimizer.minimize(loss)

  11. isTrain = False

  12. train_steps = 100

  13. checkpoint_steps = 50

  14. checkpoint_dir = ''

  15. saver = tf.train.Saver() # defaults to saving all variables - in this case w and b

  16. x_data = np.reshape(np.random.rand(10).astype(np.float32), (10, 1))

  17. with tf.Session() as sess:

  18. sess.run(tf.initialize_all_variables())

  19. if isTrain:

  20. for i in xrange(train_steps):

  21. sess.run(train, feed_dict={x: x_data})

  22. if (i + 1) % checkpoint_steps == 0:

  23. saver.save(sess, checkpoint_dir + 'model.ckpt', global_step=i+1)

  24. else:

  25. ckpt = tf.train.get_checkpoint_state(checkpoint_dir)

  26. if ckpt and ckpt.model_checkpoint_path:

  27. saver.restore(sess, ckpt.model_checkpoint_path)

  28. else:

  29. pass

  30. print(sess.run(w))

  31. print(sess.run(b))


isTrain:用来区分训练阶段和测试阶段,True表示训练,False表示测试
train_steps:表示训练的次数,例子中使用100
checkpoint_steps:表示训练多少次保存一下checkpoints,例子中使用50
checkpoint_dir:表示checkpoints文件的保存路径,例子中使用当前路径

2.1 训练阶段

使用Saver.save()方法保存模型:

  1. sess:表示当前会话,当前会话记录了当前的变量值
  2. checkpoint_dir + 'model.ckpt':表示存储的文件名
  3. global_step:表示当前是第几步

训练完成后,当前目录底下会多出5个文件。

    打开名为“checkpoint”的文件,可以看到保存记录,和最新的模型存储位置。

2.1测试阶段

    测试阶段使用saver.restore()方法恢复变量:

  1. sess:表示当前会话,之前保存的结果将被加载入这个会话
  2. ckpt.model_checkpoint_path:表示模型存储的位置,不需要提供模型的名字,它会去查看checkpoint文件,看看最新的是谁,叫做什么。

    运行结果如下图所示,加载了之前训练的参数w和b的结果

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值