OpenAI spinning up 环境安装教程(包含mujoco 安装)+ ubuntu

这里说一下我是怎么一步一步的安装spinning up的安装环境,以及mujoco是怎么安装上的。期间会有一些重复步骤。但是按照我的步骤来,有报错就及时修改,应该是可以正常安装的。
首先你需要先安装anaconda,这里教程我就不再重复了。

  1. 安装好anaconda后,创建虚拟环境 – spinningup

    conda create -n spinningup python=3.7
    conda activate spinningup
    
  2. 对于Ubuntu系统需要安装

    sudo apt-get update && sudo apt-get install libopenmpi-dev
    
  3. 之后安装spinning up 环境

    git clone https://github.com/openai/spinningup.git
    # 也可以直接下载压缩包,解压后再cd到spinningup文件夹
    cd spinningup
    pip install -e .
    
  4. 此时运行

    python -m spinup.run ppo --hid "[32,32]" --env LunarLander-v2 --exp_name installtest --gamma 0.999
    

​ 会报错

TypeError: Descriptors cannot not be created directly.
If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.

需要重新安装protobufpip3 install --upgrade protobuf==3.20.1

这时再运行 python -m spinup.run ppo --hid "[32,32]" --env LunarLander-v2 --exp_name installtest --gamma 0.999, 就不会报错了。这时就可以看到这个画面了。
在这里插入图片描述

  1. 安装mujoco

    在这个网页中,根据这个指示,下载mujoco210并存到相应的位置----~/.mujoco/mujoco210
    在这里插入图片描述
    然后运行

pip3 install -U 'mujoco-py<2.2,>=2.1'

接着将下面两句添加到 ./bashrc 中,并在终端 source 以下。

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/hsy/.mujoco/mujoco210/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/nvidia

这时候运行mujoco官方例程,会报错

Cython.Compiler.Errors.CompileError: /home/hsy/anaconda3/envs/spinningup/lib/python3.7/site-packages/mujoco_py/cymj.pyx

需要安装 pip install "cython<3". 再次运行例程,依然会报错

distutils.errors.CompileError: command '/usr/bin/gcc' failed with exit code 1

依次运行

pip3 install --upgrade pip
python3 -m pip install --upgrade setuptools
pip3 install --no-cache-dir  --force-reinstall -Iv grpcio==1.23.0
sudo apt install libosmesa6-dev
sudo apt-get install build-essential
sudo apt-get install build-essential libgl1-mesa-dev
sudo apt-get install libglew-dev libsdl2-dev libsdl2-image-dev libglm-dev libfreetype6-dev
sudo apt-get install libglfw3-dev libglfw3

此时再运行官方例程,则可正常输出
在这里插入图片描述
6. 安装完成之后,需要再次安装 pip install gym[mujoco,robotics],发现会报错

ModuleNotFoundError: No module named 'lockfile'

不用慌,直接 pip install lockfile。 然后发现要mujoco150, 那就装!到这个网站https://www.roboti.us/download.html,下载mjpro150 linux ,解压放到./mujoco/里,然后把license文件mjkey.txt 也放进去,像我这样。
在这里插入图片描述
接着到 ./.bashrc 文件中,把原来添加的换成下面这两行

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/hsy/.mujoco/mjpro150/bin

export LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libGLEW.so

变成这样(注意路径改成你自己的–替换hsy)
在这里插入图片描述
然后再运行pip install gym[mujoco,robotics] 。此时如果报错

ImportError: /home/hsy/anaconda3/envs/spinningup/bin/../lib/libstdc++.so.6: version `GLIBCXX_3.4.30' not found (required by /lib/x86_64-linux-gnu/libLLVM-15.so.1)

检查一下

strings /usr/lib/x86_64-linux-gnu/libstdc++.so.6 | grep GLIBCXX

在这里插入图片描述
没问题,然后再运行

cd /home/用户/anaconda3/envs/spinningup/bin/../lib/
mv libstdc++.so.6 libstdc++.so.6.old
ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6

pip install gym[mujoco,robotics]

安装完成,这个时候,就可以继续spinning up的学习了!

<think>好的,我现在需要帮助用户在Ubuntu 22.04上配置强化学习环境,包括必要的依赖和库。首先,我得回顾一下用户提供的参考引用,确保信息准确。 用户提到了三个引用,分别关于Ubuntu系统初始化配置、Anaconda安装MuJoCo安装。首先,我应该按照这些步骤来组织回答,同时确保LaTeX格式正确,并且生成相关问题。 第一步是系统初始化配置。根据引用[1],需要安装一些基础依赖,比如GPU驱动,但用户可能使用的是NVIDIA RTX 4080,所以需要确认驱动安装步骤。不过用户的问题中没有特别提到GPU驱动的部分,可能需要包含进去,但引用[1]里提到了系统初始化配置,可能包括更新系统和安装必要工具,比如build-essential等。 接下来是安装Anaconda,引用[2]详细说明了安装依赖和下载Anaconda的步骤。这里需要确保用户正确安装依赖项,并正确设置环境变量。同时,创建conda环境是常见的做法,所以需要指导用户创建并激活环境。 然后是安装深度学习框架,比如PyTorch或TensorFlow。这部分用户没有直接提到,但强化学习环境通常需要这些库。需要根据用户的引用,可能结合Spinning Up的配置,这里引用[2]提到了Spinning Up环境配置,可能需要安装MuJoCo相关库。 关于MuJoCo安装,引用[3]指出需要安装MuJoCo210和mujoco-py,但需要注意版本兼容性,比如mujoco-py的版本要控制在2.1到2.2之间。这部分可能会有问题,需要详细说明如何下载MuJoCo并设置环境变量,然后通过pip安装。 另外,可能需要安装其他强化学习库,比如OpenAI Gym、Stable Baselines等。这些内容虽然用户没有直接引用,但属于常见的配置步骤,应该包括进去。 现在需要检查步骤是否符合逻辑,是否遗漏了某些环节。例如,系统更新、安装依赖、Anaconda环境、深度学习框架、MuJoCo、其他库等。同时,确保每个步骤的命令正确,特别是关于路径设置和环境变量。 可能遇到的问题包括:依赖项安装失败、Anaconda路径设置、MuJoCo许可证密钥的获取、mujoco-py版本兼容性问题。需要提醒用户注意这些问题,并提供解决方法,比如下载MuJoCo后放置到~/.mujoco目录,并设置LD_LIBRARY_PATH等。 最后,生成相关问题需要考虑用户在配置过程中可能遇到的后续问题,比如性能优化、环境验证、特定工具包的安装,以及虚拟环境的必要性。 总结步骤: 1. 系统更新与基础依赖安装 2. 安装Anaconda并配置环境 3. 创建并激活conda环境 4. 安装PyTorch或TensorFlow 5. 安装MuJoComujoco-py 6. 安装强化学习库(如Gym、Spinning Up) 7. 验证安装 在每个步骤中需要正确使用命令,并注意路径和版本号,确保用户能顺利执行。同时,引用相关的参考资料,如引用[2]和[3]中的步骤。</think>### 在 Ubuntu 22.04 上配置强化学习环境的步骤 #### 1. **系统初始化配置** - 更新系统并安装基础工具: ```bash sudo apt update && sudo apt upgrade -y sudo apt install build-essential libgl1-mesa-glx libegl1-mesa libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 -y ``` 这些依赖库支持图形界面、硬件加速和基础开发环境[^2][^3]。 #### 2. **安装 Anaconda** - 下载并安装 Anaconda(以 Python 3.9 版本为例): ```bash wget https://repo.anaconda.com/archive/Anaconda3-2023.03-Linux-x86_64.sh bash Anaconda3-2023.03-Linux-x86_64.sh ``` 安装完成后,重启终端并初始化 conda: ```bash source ~/.bashrc ``` #### 3. **创建并激活虚拟环境** ```bash conda create -n rl_env python=3.9 conda activate rl_env ``` 虚拟环境可隔离依赖库版本冲突。 #### 4. **安装深度学习框架** - PyTorch(根据 CUDA 版本选择): ```bash pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 ``` - 或 TensorFlow: ```bash pip install tensorflow[and-cuda] ``` #### 5. **安装 MuJoCo 物理引擎** - 下载 MuJoCo 210: ```bash wget https://mujoco.org/download/mujoco210-linux-x86_64.tar.gz mkdir ~/.mujoco && tar -xzf mujoco210-linux-x86_64.tar.gz -C ~/.mujoco ``` - 设置环境变量: ```bash echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/.mujoco/mujoco210/bin' >> ~/.bashrc source ~/.bashrc ``` - 安装 mujoco-py: ```bash pip install 'mujoco-py<2.2,>=2.1' # 版本需与 MuJoCo 210 兼容 ``` #### 6. **安装强化学习库** - OpenAI Gym: ```bash pip install gym[all] ``` - Stable Baselines3: ```bash pip install stable-baselines3 ``` - Spinning UpOpenAI 的强化学习框架): ```bash git clone https://github.com/openai/spinningup.git cd spinningup && pip install -e . ``` #### 7. **验证环境** - 测试 Gym 和 MuJoCo: ```python import gym env = gym.make('Ant-v4') env.reset() for _ in range(1000): env.step(env.action_space.sample()) env.render() ``` ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值