tensorflow 在 checkpoint 中记录 global_step

博客提到新增加一个变量,在加载 checkpoint 时读入变量 restored_global_step。如此,每次保存 checkpoint 都会记录 global_step,且 checkpoint 文件名体现累计次数。
部署运行你感兴趣的模型镜像

新增加一个变量:

...

global_step = tf.Variable(0, name='global_step', trainable=False)

saver = tf.train.Saver(tf.global_variables(),max_to_keep=1)

加载 checkpoint 时读入变量 restored_global_step :

restored_global_step = 0

# sess = tf.InteractiveSession()
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    ckpt = tf.train.get_checkpoint_state(model_dir)  # 注意此处是checkpoint存在的目录
    if ckpt and ckpt.model_checkpoint_path:
        saver.restore(sess,ckpt.model_checkpoint_path) # 自动恢复model_checkpoint_path保存模型,一般是最新
        print("Model restored ...")
        restored_global_step = global_step.eval()
        print('restored_global_step: ',restored_global_step)
    else:
        print('Start from scratch ...')



    for step in range(max_steps):

        ...
        
        if step % 10 == 0 or (step + 1) == max_steps:
        
            checkpoint_path = os.path.join(model_dir, 'model.ckpt')
            # 计算新的 global_step
            g_step = restored_global_step+step
            # 更新 global_step
            sess.run(tf.assign(global_step,g_step))
            # 保存 
            saver.save(sess, checkpoint_path, global_step=g_step)

这样一来每次保存 checkpoint 时,都会记录下 global_step,而且 checkpoint 的文件名也是累计次数的

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

颹蕭蕭

白嫖?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值