使用方法
tf.train.Saver() 作用:保存和加载模型
saver = tf.train.Saver()
saver.save(sess, ‘路径 + 模型文件名’)
在创建这个 Saver 对象的时候, max_to_keep 参数表示要保留的最近检查点文件的最大数量,创建新文件时,将删除旧文件,默认为 5(即保留最近的 5 个检查点文件),max_to_keep=5。
需要注意的是,tensorflow变量的作用范围是在一个session里面,所以在保存模型的时候,应该在session里面通过save方法保存。
saver = tf.train.Save(max_to_keep=5)
具体格式如下:
saver = tf.train.Saver(...variables...)
__init__(
var_list=None, #var_list指定要保存和恢复的变量
reshape=False,
sharded=False,
max_to_keep=5,
keep_checkpoint_every_n_hours=10000.0,
name=None,
restore_sequentially=False,
saver_def=None,
builder=None,
defer_build=False,
allow_empty=False,
write_version=tf.train.SaverDef.V2,
pad_step_number=False,
save_relative_paths=False,
filename=None
)
global_step表示每多少次(1000次)就保存一下模型
saver.save(sess, 'my_test_model',global_step=1000)
当然在训练的时候,假设每1000次就保存一次模型,但是这些保存的文件中变化的仅仅是神经网络的variable,而网络结构没有变化,没必要重复保存.meta文件。
所以我们可以设置只让网络结构保存一次:
saver.save(sess, 'my-model', global_step=step,write_meta_graph=False)
如果只想保留最新的5个模型,并希望每1个小时保存一次,可以使用max_to_keep和keep_checkpoint_every_n_hours:
#saves a model every 1 hours and maximum 5 latest models are saved.
saver = tf.train.Saver(max_to_keep=5, keep_checkpoint_every_n_hours=1)
保存参数:
weight=[weights['wc1'],weights['wc2'],weights['wc3a']]
saver = tf.train.Saver(weight)#创建一个saver对象,.values是以列表的形式获取字典值
saver.save(sess,'model.ckpt')
恢复参数:
weight=[weights['wc1'],weights['wc2'],weights['wc3a']]
saver = tf.train.Saver(weight)#创建一个saver对象,.values是以列表的形式获取字典值
saver.restore(sess, model_filename)
简单例子(保存)
import tensorflow as tf
import os
import numpy as np
a = tf.Variable(1., tf.float32)
b = tf.Variable(2., tf.float32)
num = 10
model_save_path = './model/'
model_name = 'model'
saver = tf.train.Saver()
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
sess.run(init_op)
for step in np.arange(num):
c = sess.run(tf.add(a, b))
#checkpoint_path = os.path.join(model_save_path, model_name)
# 默认最多同时存放 5 个模型
saver.save(sess, os.path.join(model_save_path, model_name), global_step=step)
Tensorflow 会自动生成4个文件
— model.ckpt.meta,保存了 Tensorflow 计算图的结构,可以简单理解为神经网络的网络结构。它保存了tensorflow完整的网络图结构。这个文件以 *.meta为拓展名。
—model.ckpt.index 和 —model.ckpt.data--of- 文件保存了所有变量的取值。
— checkpoint 文件, 保存了一个目录下所有的模型文件列表。
简单例子(恢复)
import tensorflow as tf
import os
import numpy as np
a = tf.Variable(1., tf.float32)
b = tf.Variable(2., tf.float32)
num = 10
model_save_path = './model/'
model_name = 'model'
saver = tf.train.Saver()
with tf.Session() as sess:
init_op = tf.global_variables_initializer()
sess.run(init_op)
ckpt = tf.train.get_checkpoint_state(model_save_path)
# 载入模型,不需要提供模型的名字,会通过 checkpoint 文件定位到最新保存的模型
if ckpt and ckpt.model_checkpoint_path:
saver.restore(sess, ckpt.model_checkpoint_path)
print("load success")