Ubuntu16.04 完整版 Gym 安装及说明
1. 安装前言
之前已经专门写过一个博客,用来记录之前在 Windows 系统下安装 MuJoCo 的经历:Win 10、Win 11 安装 MuJoCo 及 mujoco-py 教程_lan 606的博客-优快云博客_windows安装mujoco
但其实在 Windows 系统下进行一些专业的开发还是会存在非常多的问题,加上我最近也是要频繁使用到 Linux 系统进行一些工作,索性在 Ubuntu 16.04 下重新安装。
至于我在 2022年 这个时间节点仍然选择 Ubuntu 16.04 这样一个即将被官方放弃维护的系统,主要还是因为我使用的一些工具在 Ubuntu 16.04 上的兼容性最好,但文中所述的方法理论上在所有的 Linux 发行版上都能得到一个不错的安装体验。
2. Gym 开发环境说明
Gym 全称是 OpenAI Gym,是 OpenAI 开发的一个工具包,有强化学习基础或者正在学习强化学习的同学应该知道,强化学习是智能体不断地与环境进行交互,并逐步从环境中获取奖励以指导智能体探索行为的一种方法。而开发 Gym 的目标就是使得在整个开发强化学习算法过程中,不需要额外考虑复杂的环境搭建过程,只专注于算法本身性能的提升。
具体的关于 Gym 的说明可参考官方文档:Basic Usage - Gym Documentation (gymlibrary.dev)
具体的官方 GitHub 链接如下:GitHub - openai/gym: A toolkit for developing and comparing reinforcement learning algorithms.
Gym 的环境总共有五大类环境,分别是 Atari、MuJoCo、Toy Text、Classic Control 和 Box2D,其中 Toy Text 和 Classic Control 都是基础版 gym 就已经包括的环境大类,而其他三项都是需要额外进行安装的环境。





有一篇博客对 OpenAI Gym 的环境进行了完整的汇总,具体参见:强化学习基础篇(十)OpenAI Gym环境汇总 - 简书 (jianshu.com)
3. 完整版 Gym 的安装
3.1 Anaconda 创建虚拟环境
Anaconda 是一个开源的 Python 发行版本,其最大的优势是可以建立多个虚拟环境,且虚拟环境之间互不干扰。这样可以在多个环境间切换,应用在不同的 Python 工程中。
具体的 Anaconda 安装包可以在清华大学开源软件镜像站中下载,镜像站的网址为:Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
具体我下载的是 Anaconda3-2020.07-Linux-x86_64.sh 版本。
Terminal 中先 cd 到具体的下载地址,然后输入下面的命令行:
bash Anaconda3-2021.11-Linux-x86_64.sh
具体的安装细节可参考下述链接:Ubuntu安装Anaconda详细步骤(Ubuntu21.10,Anaconda3)_萝北村的枫子的博客-优快云博客_ubuntu安装anaconda
安装完成之后建议重启一下系统,然后再次 Ctrl + Alt + T 打开 Terminal 之后,就会出现下述界面:

由于每次自动打开 base 环境,但实际使用并不频繁,所以可使用下述命令关闭每次自动打开的虚拟环境:
conda config --set auto_activate_base false
可使用下述命令查看本机中已经创建的 Anacoda 虚拟环境:
conda info -e

上图中的 py37 虚拟环境就是本次安装完整版 Gym 所使用的虚拟环境。
若只存在一个 base 环境,可采用下述命令创建一个自己的虚拟环境:
conda create -n py37 python==3.7.0
在创建完虚拟环境之后,需采用下述命令激活,这样会在命令行开头多一个环境名:
conda activate py37
如果想让当前的虚拟环境处于失效状态,需在 Terminla 中运行下述命令:
conda deactivate
同时也可以注意到命令行开头的环境名消失不见了。

进入到虚拟环境之后,与正常的 Python 环境一样,都可以使用 pip 命令进行库的安装。
- 注1:上述创建 Anaconda 虚拟环境的步骤与 Windows 系统下进行虚拟环境的创建完全相同。
- 注2:OpenAI Gym 官方 GitHub 中说明支持 Linux 和 macOS 系统上的 Python 3.7-3.10,因而不建议使用其他版本的 Python。
- 注3:本人之前的使用过程中,从 Python 3.8 开始移除了
time.clock()方法,这会导致env.render()方法失效,所以建议安装 Python 3.7。
3.2 安装 gym[box2d]
如果在上述虚拟环境中直接进行 pip install gym 命令,会直接给你安装最新的精简版 Gym,该版本的 Gym 不包含任何扩展环境,所以在该版本的 Gym 中无法使用Atari、MuJoCo 和 Box2D,只能使用基本的 Toy Text 和 Classic Control。
而在 Gym 官方文档首页展示的 'LunarLander-v2' 这一经典环境都是需要 Box2D 的。
3.2.1 采用官方 GitHub 教程进行安装的报错及解决方案
首先是安装精简版的 Gym:
pip install gym
然后,官方文档给出的方案是采用如下命令进行安装:
pip

本文详细介绍了在Ubuntu16.04上安装完整版Gym的步骤,包括使用Anaconda创建虚拟环境,安装gym[box2d]、gym[atari]和gym[mujoco]的详细过程,以及针对各种环境的测试。安装过程中解决了官方GitHub教程的报错问题,并提供了环境运行的示例代码。
最低0.47元/天 解锁文章
5521

被折叠的 条评论
为什么被折叠?



