Ubuntu16.04 完整版 Gym 安装及说明

本文详细介绍了在Ubuntu16.04上安装完整版Gym的步骤,包括使用Anaconda创建虚拟环境,安装gym[box2d]、gym[atari]和gym[mujoco]的详细过程,以及针对各种环境的测试。安装过程中解决了官方GitHub教程的报错问题,并提供了环境运行的示例代码。

1. 安装前言

之前已经专门写过一个博客,用来记录之前在 Windows 系统下安装 MuJoCo 的经历:Win 10、Win 11 安装 MuJoCo 及 mujoco-py 教程_lan 606的博客-优快云博客_windows安装mujoco

但其实在 Windows 系统下进行一些专业的开发还是会存在非常多的问题,加上我最近也是要频繁使用到 Linux 系统进行一些工作,索性在 Ubuntu 16.04 下重新安装。

至于我在 2022年 这个时间节点仍然选择 Ubuntu 16.04 这样一个即将被官方放弃维护的系统,主要还是因为我使用的一些工具在 Ubuntu 16.04 上的兼容性最好,但文中所述的方法理论上在所有的 Linux 发行版上都能得到一个不错的安装体验。

2. Gym 开发环境说明

Gym 全称是 OpenAI Gym,是 OpenAI 开发的一个工具包,有强化学习基础或者正在学习强化学习的同学应该知道,强化学习是智能体不断地与环境进行交互,并逐步从环境中获取奖励以指导智能体探索行为的一种方法。而开发 Gym 的目标就是使得在整个开发强化学习算法过程中,不需要额外考虑复杂的环境搭建过程,只专注于算法本身性能的提升。

具体的关于 Gym 的说明可参考官方文档:Basic Usage - Gym Documentation (gymlibrary.dev)

具体的官方 GitHub 链接如下:GitHub - openai/gym: A toolkit for developing and comparing reinforcement learning algorithms.

Gym 的环境总共有五大类环境,分别是 AtariMuJoCoToy TextClassic ControlBox2D,其中 Toy TextClassic Control 都是基础版 gym 就已经包括的环境大类,而其他三项都是需要额外进行安装的环境。

在这里插入图片描述

图1. Atari 环境

在这里插入图片描述

图2. MuJoCo 环境

在这里插入图片描述

图3. Toy Text 环境演示

在这里插入图片描述

图4. Classic Control 环境

在这里插入图片描述

图5. Box2D 环境

有一篇博客对 OpenAI Gym 的环境进行了完整的汇总,具体参见:强化学习基础篇(十)OpenAI Gym环境汇总 - 简书 (jianshu.com)

3. 完整版 Gym 的安装

3.1 Anaconda 创建虚拟环境

Anaconda 是一个开源的 Python 发行版本,其最大的优势是可以建立多个虚拟环境,且虚拟环境之间互不干扰。这样可以在多个环境间切换,应用在不同的 Python 工程中。

具体的 Anaconda 安装包可以在清华大学开源软件镜像站中下载,镜像站的网址为:Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

具体我下载的是 Anaconda3-2020.07-Linux-x86_64.sh 版本。

Terminal 中先 cd 到具体的下载地址,然后输入下面的命令行:

bash Anaconda3-2021.11-Linux-x86_64.sh

具体的安装细节可参考下述链接:Ubuntu安装Anaconda详细步骤(Ubuntu21.10,Anaconda3)_萝北村的枫子的博客-优快云博客_ubuntu安装anaconda

安装完成之后建议重启一下系统,然后再次 Ctrl + Alt + T 打开 Terminal 之后,就会出现下述界面:

在这里插入图片描述

图6. 安装完成 Anaconda 后首次打开 Terminal

由于每次自动打开 base 环境,但实际使用并不频繁,所以可使用下述命令关闭每次自动打开的虚拟环境:

conda config --set auto_activate_base false

可使用下述命令查看本机中已经创建的 Anacoda 虚拟环境:

conda info -e

在这里插入图片描述

图7. 使用命令查看 Anaconda 已经创建的环境

上图中的 py37 虚拟环境就是本次安装完整版 Gym 所使用的虚拟环境。

若只存在一个 base 环境,可采用下述命令创建一个自己的虚拟环境:

conda create -n py37 python==3.7.0

在创建完虚拟环境之后,需采用下述命令激活,这样会在命令行开头多一个环境名:

conda activate py37

如果想让当前的虚拟环境处于失效状态,需在 Terminla 中运行下述命令:

conda deactivate

同时也可以注意到命令行开头的环境名消失不见了。

在这里插入图片描述

图8. Anaconda 环境的激活与反激活

进入到虚拟环境之后,与正常的 Python 环境一样,都可以使用 pip 命令进行库的安装。

  • 注1:上述创建 Anaconda 虚拟环境的步骤与 Windows 系统下进行虚拟环境的创建完全相同。
  • 注2:OpenAI Gym 官方 GitHub 中说明支持 Linux 和 macOS 系统上的 Python 3.7-3.10,因而不建议使用其他版本的 Python。
  • 注3:本人之前的使用过程中,从 Python 3.8 开始移除了 time.clock() 方法,这会导致 env.render() 方法失效,所以建议安装 Python 3.7。

3.2 安装 gym[box2d]

如果在上述虚拟环境中直接进行 pip install gym 命令,会直接给你安装最新的精简版 Gym,该版本的 Gym 不包含任何扩展环境,所以在该版本的 Gym 中无法使用AtariMuJoCoBox2D,只能使用基本的 Toy TextClassic Control

而在 Gym 官方文档首页展示的 'LunarLander-v2' 这一经典环境都是需要 Box2D 的。

3.2.1 采用官方 GitHub 教程进行安装的报错及解决方案

首先是安装精简版的 Gym:

pip install gym

然后,官方文档给出的方案是采用如下命令进行安装:

pip 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值