26、深度强化学习：CartPole 游戏的 Q 学习与 SARSA 学习实现

open4

于 2025-11-09 12:43:43 发布

阅读量19

点赞数

CC 4.0 BY-SA版权

分类专栏： 9个项目玩转深度学习文章标签：深度强化学习 DQN SARSA

本文链接：https://blog.youkuaiyun.com/open4/article/details/154632872

9个项目玩转深度学习专栏收录该内容

27 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度强化学习：CartPole 游戏的 Q 学习与 SARSA 学习实现

在强化学习领域，我们常常通过构建模型来让智能体在特定环境中学习并执行任务。本文将详细介绍如何使用深度 Q 学习（DQN）和深度 SARSA 学习在 OpenAI Gym 的 CartPole-v1 游戏中训练智能体，并对模型性能进行测试和评估。

测试 DQN 模型

首先，我们需要测试训练好的 DQN 模型在新游戏中的表现。以下是测试函数的代码：

def test(env, model, states, episodes=100, render=False):
    """Test the performance of the DQN agent."""
    scores_test = []
    for episode in range(1, (episodes+1)):
        state = env.reset()
        state = state.reshape(1, states)
        done = False
        time_step = 0
        while not done:
            if render:
                env.render()
            action = np.argmax(model.predict(state)[0])
            new_state, reward, done, info = env.step(action)
            new_state = new_state.