和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。由于近年来深度强化学习(Deep Reinforcement Learning)的兴起,各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym,MuJoCo,rllab, DeepMind Lab, TORCS, PySC2等一系列优秀的平台。
博主环境
Ubuntu16.04
Anaconda2
python 3.6(建议重新在anaconda中创建新的环境,以下操作均在conda创建环境下配置)
tensorflow-gpu 1.4.1 (baseline 最低要求1.4.1)
CUDA 8.0 (CUDA的安装可参考https://blog.youkuaiyun.com/Hansry/article/details/81008210)
Cudnn 6.0
1.安装mujoco
MuJoCo(Multi-Joint dynamics with Contact)是一个物理模拟器,可以用于机器人控制优化等研究。
1.准备工作
在官网上下载 mjpro150 linux
,同时点击Licence
下载许可证,需要full name
email address
computer id
等信息,其中根据使用平台下载 getid_linux(可执行文件)
获取 computer id
, 步骤如下:
$ chmod a+x getid_linux (给予执行权限)
$ ./getid_linux
输出结果类似于 LINUX_A1EHAO_Q8BPHTIM10F05D0S3TB3293
点击submint
后,从输入的邮箱中下载证书mjkey.txt
2.环境配置
2.1 创建隐藏文件夹并将 mjpro150_linux
拷贝到 mujoco
文件夹中
mkdir ~/.mujoco
cp mjpro150_linux.zip ~/.mujoco
cd ~/.mujoco
unzip mjpro150_linux.zip
2.2 将证书mjkey.txt
拷贝到创建的隐藏文件夹中
cp mjkey.txt ~/.mujoco
cp mjkey.txt ~/.mujoco/mjpro150/bin
2.3.添加环境变量, 打开~/.bashrc
文件,将以下命令添加进去
export LD_LIBRARY_PATH=~/.mujoco/mjpro150/bin${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export MUJOCO_KEY_PATH=~/.mujoco${MUJOCO_KEY_PATH}
3.运行结果
cd ~/.mujoco/mjpro150/bin
./simulate ../model/humanoid.xml

2.安装mujoco_py
首先现在官网上下载安装 mujoco_py源码, 注意的是在这里安装的时候可能会缺很多包,但是提示什么装什么就行了。