强化学习 — mujoco、mujoco_py、gym 和 baselines的环境配置

最新推荐文章于 2025-05-14 18:02:27 发布

Hansry

最新推荐文章于 2025-05-14 18:02:27 发布

阅读量6.6k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Reinforcement Learning 文章标签： mujoco mujoco_py pym

本文链接：https://blog.youkuaiyun.com/Hansry/article/details/80998720

本文详细介绍了在Ubuntu 16.04上配置强化学习环境的过程，包括安装mujoco、mujoco_py、gym和baselines。内容涵盖MuJoCo的下载与授权，环境变量设置，mujoco_py的安装，OpenAI Gym的安装及使用，以及baselines库的安装与HER算法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

和其它的机器学习方向一样，强化学习（Reinforcement Learning）也有一些经典的实验场景，像Mountain-Car，Cart-Pole等。由于近年来深度强化学习（Deep Reinforcement Learning）的兴起，各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym，MuJoCo，rllab, DeepMind Lab, TORCS, PySC2等一系列优秀的平台。

博主环境
Ubuntu16.04
Anaconda2
python 3.６（建议重新在anaconda中创建新的环境，以下操作均在conda创建环境下配置）
tensorflow-gpu 1.4.1 （baseline 最低要求1.4.1）
CUDA 8.0 (CUDA的安装可参考https://blog.youkuaiyun.com/Hansry/article/details/81008210)
Cudnn 6.0

1.安装mujoco

MuJoCo（Multi-Joint dynamics with Contact）是一个物理模拟器，可以用于机器人控制优化等研究。
1.准备工作
在官网上下载 mjpro150 linux ，同时点击Licence下载许可证，需要full name email address computer id 等信息，其中根据使用平台下载 getid_linux（可执行文件） 获取 computer id, 步骤如下：

$ chmod a+x getid_linux (给予执行权限)
$ ./getid_linux

输出结果类似于 LINUX_A1EHAO_Q8BPHTIM10F05D0S3TB3293
这里写图片描述
点击submint 后，从输入的邮箱中下载证书mjkey.txt

2.环境配置
2.1 创建隐藏文件夹并将 mjpro150_linux 拷贝到 mujoco 文件夹中

mkdir ~/.mujoco    
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip

2.2 将证书mjkey.txt拷贝到创建的隐藏文件夹中

cp mjkey.txt ~/.mujoco  
cp mjkey.txt ~/.mujoco/mjpro150/bin

2.3.添加环境变量, 打开～/.bashrc 文件,将以下命令添加进去

export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}

3.运行结果

cd ~/.mujoco/mjpro150/bin
./simulate ../model/humanoid.xml

最低0.47元/天解锁文章

200万优质内容无限畅学