Mujoco、Mujoco-py、gym/baseline的环境配置 (可用于UC Berkeley CS294-112 18FA 课程学习)

这篇博客详细记录了在Ubuntu 16.04上,使用Anaconda3和Python 3.6配置Mujoco、mujoco-py及gym的步骤,包括环境配置、许可证获取、安装过程中的问题解决,以及CS294-112课程作业的执行。博主还分享了在bashrc中设置环境变量的经验,并提供了安装baselines和运行HER算法的相关信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0. 本人环境

(以下均可根据右侧网址进行环境配置https://blog.youkuaiyun.com/linyijiong/article/details/84198384


Ubuntu16.04 , Anaconda3 , python 3.6 ,  tensorflow-gpu 1.10.1 , CUDA 9.0 , cuDNN8.0.

 

以下安装配置均在虚拟环境中进行

 

 

1.安装mujoco

MuJoCo(Multi-Joint dynamics with Contact)是一个物理模拟器,可以用于机器人控制优化等研究。


1.1 准备工作

(参考网址: https://github.com/openai/mujoco-py#obtaining-the-binaries-and-license-key

 

1.1.1 

下载 mjpro150 linux

 

1.1.2

点击Licence,进行许可证注册(mujoco不开源)

根据你的情况进行选择一年或者30天的许可时期。通过认证后,会将account number发至邮箱。

根据使用平台下载 getid_linux(可执行文件) 获取 computer id, 步骤如下:

chmod +x getid_linux
/getid_linux 

输出结果类似于 LINUX_A1EHAO_Q8BPHTASDM1005D03TB3293

将上述两者输入网站,如下图。


点击Register computer 后,你的邮箱收到类似以下的邮件。


从输入的邮箱中下载证书mjkey.txt ,后面将会使用。

1.2 环境配置


1.2.1

创建隐藏文件夹并将 上一步下载的mjpro150_linux.zip 拷贝到 mujoco 文件夹中。解压后路径为:~/.mujoco/mjpro150

mkdir ~/.mujoco    
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip

 

1.2.2

将证书mjkey.txt拷贝到创建的隐藏文件夹中

cp mjkey.txt ~/.mujoco
cp mjkey.txt ~/.mujoco/mjpro150/bin

 

1.2.

添加环境变量~/.bashrc

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/bourne/.mujoco/mjpro150/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/u
### Mujoco-py 的用途 Mujoco-py 是一个 Python 接口,用于MuJoCo(Multi-Joint dynamics with Contact)物理引擎进行交互。MuJoCo 是一个高效的物理仿真平台,广泛应用于强化学习、机器人控制和生物力学研究中。mujoco-py 允许开发者通过 Python 编程语言来加载模型、执行仿真、获取状态信息并实时控制仿真环境 [^4]。 它的一个主要用途是支持 OpenAI Gym 环境中的连续控制任务,例如模拟人形机器人、机械臂或其他具有复杂动力学特性的系统。借助 mujoco-py,研究人员可以更轻松地开发和测试强化学习算法 [^2]。 ### 安装方法 要安装 `mujoco-py`,首先需要确保已经正确安装了 MuJoCo 二进制文件,并且拥有有效的许可证密钥(对于 MuJoCo 2.0 及更高版本)。以下是安装步骤: 1. **安装 MuJoCo** - 对于 Linux 用户,可以从 [MuJoCo 官方网站](https://www.roboti.us/index.html) 下载预编译库。 - 将解压后的 `mjpro150` 文件夹放置在合适的位置,例如 `~/.mujoco/mjpro150`。 - 将 `bin` 目录添加到动态链接库路径:`export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin:$LD_LIBRARY_PATH` 2. **创建虚拟环境(推荐)** 使用 `virtualenv` 或 `venv` 创建隔离的 Python 环境以避免依赖冲突: ```bash python3 -m venv mujoco-env source mujoco-env/bin/activate ``` 3. **安装 mujoco-py** ```bash pip install mujoco-py ``` 如果遇到 OpenGL 依赖问题,可能还需要安装一些额外的系统库,如 `libgl1-mesa-glx` 和 `libglfw3` 。 ### 使用方法示例 以下是一个使用 `mujoco-py` 加载简单模型并运行仿真的基本示例: ```python import os from mujoco_py import load_model_from_path, MjSim, MjViewer # 加载模型文件(.xml) model_path = os.path.expanduser('~/your_mujoco_model.xml') model = load_model_from_path(model_path) sim = MjSim(model) viewer = MjViewer(sim) # 运行仿真循环 for i in range(1000): sim.data.ctrl[:] = [1.0] * model.nu # 设置控制信号 sim.step() # 执行一步仿真 viewer.render() # 渲染画面 ``` 此代码加载了一个 MJCF 格式的 XML 模型文件,初始化仿真环境,并在一个简单的循环中应用控制输入并渲染仿真视图 [^4]。 ### 注意事项 - 确保你的 MuJoCo 许可证文件 `mjkey.txt` 已经放置在 `~/.mujoco/` 目录下。 - 如果你使用的是较新版本的 MuJoCo(如 MuJoCo 2.1+),请确认使用的 `mujoco-py` 版本是否兼容。 - 在某些操作系统上,尤其是 macOS,可能需要额外配置 X11 支持或 OpenGL 驱动。 ---
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值