stable_baselines快速入门

最新推荐文章于 2025-09-19 21:43:27 发布

原创

最新推荐文章于 2025-09-19 21:43:27 发布 · 3.3k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能 #机器学习

该博客介绍了OpenAI的强化学习库baselines，它提供了一套快速配置强化学习算法的组件。文章详细讲解了如何安装库，以及BaseRLClass的基本参数，如policy、env等。通过一个示例展示了如何使用stable-baselines的DQN算法训练和运行CartPole-v0环境的倒立摆任务。在训练完成后，模型被保存以便后续使用。

0 简介

baselines是OpenAI推出的一套强化学习算法组件，用于快速配置强化学习算法，对入门者比较友好

1 安装

pip install stable-baselines

2 参数介绍

Base RL Class

common interface for all the RL algorithms

class stable_baselines.common.base_class.BaseRLModel(policy,env,verbos=0,*,requires_vec_env,policy_base,policy_kwargs=None,seed=None,n_cpu_tf_sess=None)