Tensorflow 测试RL算法，保存模型并读取进行测试

最新推荐文章于 2024-09-01 09:23:09 发布

原创

最新推荐文章于 2024-09-01 09:23:09 发布 · 1.3k 阅读

7 ·

CC 4.0 BY-SA版权

保存模型

RL中，我们一般都把一个网络结构写在一个类里面，保存的时候也是，可以如下写一个 save_net 函数：

def save_net(self):
    saver = tf.train.Saver()
    save_path = saver.save(self.sess, "./dqn/model/file_name.ckpt")
    print("Save to path: ", save_path)

在RL算法进行完N轮的训练之后，调用该函数进行模型保存：agent.save_net()
可以看到，会在model文件夹下多出四个文件：
在这里插入图片描述
也可以输出保存前的参数，进行观察，以便确认读取模型时是否成功读取了参数：

w1 = tf.get_default_graph().get_tensor_by_name('eval_net/l1/w1:0')  # 获得variable对应的Tensor
print(self.sess.run(w1))  # run一下这个Tensor得到结果

读取模型

首先注意，读取模型用于测试时，我们需要保证用到的变量和训练时的是一样的，比如测试DQN模型的效果：

class Test4DQ

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Test_hh112

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

TensorFlow深度学习实战（31）——强化学习（Reinforcement learning，RL）

盼小辉丶的博客

08-09

1764

强化学习 (Reinforcement learning, RL) 与监督学习和无监督学习模型不同，强化学习智能体从零开始(即没有先验信息)，通过多次试错实现学习目标，在这个过程中，唯一的输入就是来自环境的反馈。研究表明，在强化学习领域中持续的竞争可能是智能体进化的一个原因，RL 在通用人工智能 (Artificial General Intelligence，AGI) 中发挥重要作用，本节将介绍 RL 算法的基本概念与应用，并深入探讨不同的 RL 算法。

DL Keras/Tensorflow/Keras-rl/Gym/Python

weixin_47368014的博客

08-28

857

DL Keras/Tensorflow/Keras-rl/Gym/Python背景环境CartPole 背景 Keras封装了TensorFlow；Keras-rl封装了Reinforcement Learning这部分的功能；OpenAI Gym则模块化了Tensorflow&Keras里的Environment这个概念，使得“应用和算法隔离”这个思想有了具体的实现，Gym的Env可以直接怼进sKeras/Keras-rl的Agent里。由于TensorFlow的发展到2.0时代，只有Python

参与评论您还未登录，请先登录后发表或查看评论

Python库 | tensorflow_rl-0.2.0-py3-none-any.whl

04-26

资源分类：Python库所属语言：Python 使用前提：需要解压资源全名：tensorflow_rl-0.2.0-py3-none-any.whl 资源来源：官方安装方法：https://lanzao.blog.youkuaiyun.com/article/details/101784059

探索深度学习的极限：TensorFlow-RL

gitblog_00013的博客

06-03

422

探索深度学习的极限：TensorFlow-RL 在人工智能领域，强化学习(RL)正迅速成为解锁智能代理复杂行为的关键技术。今天，我们将探索一个令人兴奋的开源库——TensorFlow-RL，它基于强大的TensorFlow框架，为您提供了通往深度强化学习世界的便捷通道。项目介绍 TensorFlow-RL是一个全面且不断更新的实现集合，旨在涵盖当前强化学习领域的前沿算法。从经典的A3C（异步优势...

Deep-RL:Tensorflow实现RL算法

05-10

DeepRL Tensorflow流行的深度RL算法的模块化实现。我的主要原则是通过不同的算法重用尽可能多的组件，并在带有原始像素输入的经典控制任务（如CartPole和Atari游戏）之间轻松切换。实现的算法：深度Q学习（DQN）双重深度Q学习（DDQN）深度Q学习+优先体验重播（DQN_PER）双重深度Q学习+优先体验重播（DDQN_PER）深度Q学习+一日内（DQN_InAday）相依性在macOS 10.13中测试 OpenAI体育馆 Tensorflow v1.2.1 Python 3.6 用法 main.py包含所有已实现算法的示例参考

TensorFlow强化学习（RL）项目实战指南

热门推荐

深度强化学习(DeepRL)探索博客

05-22

1万+

Atari 游戏所需的动作是离散的，且属于低维（只有少数几个动作），但现实生活中很多问题都是连续的，且维度比较高，比如机器人控制（多个自由度)等。虽然可以对连续性高维度的动作做离散型的处理，但是对于一个经过离散处理的大状态空间，使用DQN训练仍然是仍然是一个比较棘手的问题，因为DQN算法的核心思想是利用随机策略进行探索，对于高维度的来说，第一个问题是：模型很难收敛，第二个问题是需要在探索和利用之间进行协调

tensorflow使用手册

04-07

- **回调（Callbacks）**：在训练过程中，可以设置回调函数监控指标、保存模型、调整学习率等。 - **评估（Evaluation）**：通过计算验证集上的指标来评估模型性能。 - **预测（Prediction）**：使用训练好的模型对...

第3章(3.11～3.16节)模型细节/Kaggle实战【深度学习基础】--动手学深度学习【Tensorflow2.0版本】

土豆洋芋山药蛋的博客

01-31

1672

项目地址：https://github.com/TrickyGo/Dive-into-DL-TensorFlow2.0 UC 伯克利李沐的《动手学深度学习》开源书一经推出便广受好评。很多开发者使用了书的内容，并采用各种各样的深度学习框架将其复现。现在，《动手学深度学习》书又有了一个新的复现代码版本——TensorFlow2.0 版，短时间内成为了github上千star项目，欢迎关注。 3....

【Mask-RCNN】环境配置+模型训练+测试

qq_44703886的博客

09-25

1万+

介绍 Mask-RCNN作为实例分割算法，在Faster RCNN网络框架的基础上进行了扩展，增加一个用于实例分割的掩码分支.

TensorFlow读取网络模型

不想随波逐流的大学生一枚，我们每个人都在努力奔跑

05-20

458

介绍了如何利用TensorFlow读取网络模型

tensorflow 训练模型的保存与读取已保存的模型进行测试

Muzi_Water的博客

08-23

3135

在实际中，通常需要将经过大量训练的较好模型参数保存起来，在实际应用以训练好的模型进行预测。 TensorFlow中提供了模型保存的模块 tensorflow.train.Saver() 1. 导入tensorflow模块 import tensorflow as tf 2. 创建模型保存的Saver对象 saver = tf.train.Sa...

【RL笔记】基于tensorflow实现RL的policy based算法

roguesir的博客

08-06

2926

基于tensorflow实现RL的policy based算法

最全Tensorflow模型保存和提取的方法——附实例

缘分天空，美丽的梦的博客

05-06

1万+

一、Tensorflow模型的保存和提取方法1、Tensorflow通过tf.train.Saver类实现神经网络模型的保存和提取。tf.train.Saver对象saver的save方法将Tensoreflow模型保存到指定的路径中，saver.save(sess,'model/model.ckpt).实际在这个文件目录下有4个文件：checkpoint 文件保存了一个录下多有的模型文件列表，m...

莫烦 tensorflow 笔记（一）搭建神经网络

My Honor！ My World！

08-19

1088

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Wed Aug 16 08:56:03 2017@author: xiaolian """ # add layersimport tensorflow as tf import numpy as np import matplotlib.pyplot as plt# input

了解强化学习，这一篇就够了！

weixin_30535167的博客

10-30

775

强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验. 从无到有强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. 这就是一个完整的强化学习过...

OPENAI Baeslines 详解（五）保存数据、模型

Dr.Zee的博客

09-05

2123

Zee带你看代码系列学习强化学习，码代码的能力必须要出众，要快速入门强化学习搞清楚其中真正的原理，读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章，希望对大家有多帮助。另外，我会将所有的文章及所做的一些简单项目，放在我的个人网页上。水平有限，可能有理解不到位的地方，希望大家主动沟通交流。邮箱：zachary2wave@163.com OPENAI Baeslines 详解（五...

关于agent的保存以及在结束点处继续训练，以及解决经验池满的问题

记录老板的每次pua，分享领导每天的毒鸡汤...

03-05

1456

Save Candidate Agents During training, you can save candidate agents that meet conditions you specify in the SaveAgentCriteria and SaveAgentValue options of your rlTrainingOptions object. For instance, you can save any agent whose episode reward exceeds a

Tensorflow 测试RL算法，保存模型 并 读取进行测试

保存模型

读取模型

Tensorflow 测试RL算法，保存模型并读取进行测试