强化学习:环境配置windows

本文详细介绍如何在Windows环境下安装Gym环境,包括更改pip和conda的国内镜像源,安装Gym及其依赖包如atari_py和box2d-py,通过源码安装OpenAI Gym和OpenAI Universe,以及如何测试Gym环境。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、安装gym

https://openai.com/ 

pip更改国内镜像源


在windows文件管理器中输入%APPDATA%
会定位到目录C:\Users\Administrator\AppData\Roaming\,在该目录下新建pip文件夹,在pip文件夹下新建pip.ini文件
在新建的pip.ini文件中输入以下内容并保存

[global]
timeout = 6000
index-url = http://mirrors.aliyun.com/pypi/simple/
trusted-host = mirrors.aliyun.com

conda更改国内镜像源

Win+R输入cmd打开命令行窗口,执行命令
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
执行命令 conda config --set show_channel_urls yes

此时目录C:\Users<username>目录下会生成配置文件.condarc
修改上述配置文件,删除上述配置文件.condarc中的第三行(即-default),然后保存
执行命令conda info查看配置信息
测试一下,安装requests,执行命令conda install requests

pip安装gym

$ pip install gym

安装gym下atari_py

$ pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py

安装gym下box2D_py

先到 http://www.swig.org/download.html 中下载 swigwin-3.0.12
下载完后,解压缩 d:/swigwin-3.0.12,然后打开 系统环境变量设置
打开:“我的电脑->属性->高级->环境变量->系统变量”
把 d:/swigwin-3.0.12 添加到 path 变量中
重启后执行
$ pip install box2d-py

源码安装

Installing OpenAI Gym and OpenAI Universe

$ git clone https://github.com/openai/gym.git

$ cd gym

$ pip install -e '.[all]'

安装atari环境

$ pip install -e '.[atari]'

安装棋盘类游戏

$ pip install -e '.[board_game]'

安装Box2d控制类游戏

$ pip install -e '.[box2d]'

安装经典控制类游戏

$ pip install -e '.[classic_control]'

安装MuJoCo控制类游戏

$ pip install -e '.[mujoco]'

OpenAI Universe

$ git clone https://github.com/openai/universe.git

$ cd universe

$ pip install -e .

2、测试

import gym
env = gym.make('CartPole-v0')
env.reset()
env.render()

 

### 设置Windows上的强化学习开发环境 #### 配置Windows Subsystem for Linux (WSL 2) 为了在 Windows 上创建一个适合于深度学习和强化学习的开发环境,建议先安装 WSL 2。这允许用户在一个轻量级的虚拟机中运行完整的Linux内核,从而能够访问大量的命令行工具以及软件包管理器,如 `apt` 和 `yum`。 对于 Windows 用户来说,在启用此功能之前,可能还需要开启一些额外的功能选项,并确保已更新至最新版本的操作系统[^1]: ```bash wsl --install -d Ubuntu ``` 这条命令会自动完成大部分工作,包括下载最新的Ubuntu镜像文件并将其设置为默认分发版。如果希望指定其他发行版,则只需更改 `-d` 参数后的名称即可。 #### 安装Python及相关依赖项 一旦有了可用的Linux子系统之后,下一步就是准备编程所需的解释器和其他必要的组件。打开新安装好的终端窗口,执行如下操作来获取最新状态下的 Python 版本及其科学计算栈: ```bash sudo apt update && sudo apt upgrade -y sudo apt install python3-pip python3-dev build-essential libssl-dev libffi-dev python3-setuptools pip3 install --upgrade pip setuptools wheel virtualenv ``` 这些指令不仅限于此;具体需求取决于个人项目的要求。例如,某些情况下还可能会涉及到图形界面的支持库或是特定硬件加速驱动程序等。 #### 创建隔离的工作空间 考虑到不同项目的兼容性和安全性问题,强烈建议每一个独立的任务都拥有自己专属的空间来进行实验和发展。借助 Virtualenv 工具可以轻松做到这一点: ```bash virtualenv venv source ./venv/bin/activate ``` 每次启动新的shell session时都需要重复激活过程,不过也可以考虑把上述两行加入到 `.bashrc` 文件里实现自动化加载效果。 #### 安装PyTorch及其他必要库 现在进入到实际业务逻辑部分——即引入核心框架和支持模块。这里以 PyTorch 为例说明怎样快速建立起一套适用于大多数场景的基础架构: ```bash pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117 ``` 注意 URL 中包含了 CUDA 的版本号 (`cu117`) ,应根据实际情况调整该参数以匹配本地 GPU 设备情况。如果不打算利用 NVIDIA 显卡资源的话则可以直接去掉这部分附加路径。 #### 安装OpenAI Gym 最后一步是要集成 OpenAI Gym 库,它提供了丰富的测试平台让开发者们验证自己的模型性能。同样地,通过简单的 pip 命令就能搞定一切: ```bash pip install gym[atari,accept-rom-license] ``` 这个扩展形式意味着除了基本功能外还会一并拉取 Atari 游戏模拟所需的各种素材资料。当然也可以单独挑选感兴趣的部分进行定制化部署。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值