openai的gym baseline spiningup 深度强化学习环境安装 手撸gym环境demo

按照spiningup我们学习DRL,链接
https://github.com/openai/gym
https://github.com/openai/baselines

1. 安装anaconda(为了方便包管理)

参考:https://docs.continuum.io/anaconda/install/linux/
首先安装必要依赖:apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6
然后sha256sum /path/filename 检查是否和https://docs.continuum.io/anaconda/install/hashes/的相应系统版本的sha256相同,一般相同。
然后bash ~/Downloads/Anaconda3-xxxxx-Linux-x86_64.sh
默认安装即可
然后conda create -n spinningup python=3.6创建强化学习的环境。
source activate spinningup激活环境。

2.Installing OpenMPI(高性能消息传递库)

sudo apt-get update && sudo apt-get install libopenmpi-dev

3.Installing Spinning Up

提示Spinning Up defaults to installing everything in Gym except the MuJoCo environments
git clone https://github.com/openai/spinningup.git
cd spinningup
pip install -e .
可以看到spinningup安装的时候gym-0.15.7依赖被安装了
(在spinningup的环境下)
测试:
python -m spinup.run ppo --hid “[32,32]” --env LunarLander-v2 --exp_name installtest --gamma 0.999
训练十分钟后
python -m spinup.run test_policy data/installtest/installtest_s0
python -m spinup.run plot data/installtest/installtest_s0

安装mujoco

https://blog.youkuaiyun.com/farm_coder/article/details/90295093

安装mujoco-py

pip install -U ‘mujoco-py<2.1,>=2.0’ 即可
我遇到了ImportError: No module named ‘fasteners’

原因是我刚刚使用pip3 install -U ‘mujoco-py<2.1,>=2.0’,而,pip3是系统自带的python3.5的pip所以官方的pip3需要修改成pip,使用conda的pip。

然后提示
Please add following line to .bashrc:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/lib/nvidia-384
添加之后遇到/tmp/pip-install-amwwpr1j/mujoco-py/mujoco_py/gl/eglshim.c:4:21: fatal error: GL/glew.h: No such file or directory

解决方案:https://github.com/openai/mujoco-py/issues/180
sudo apt-get install libglew-dev之后完美解决并且在python交互界面使用OK


如果你按照https://github.com/openai/mujoco-py的readme安装好了mujoco2.00以及mujoco-py2.0

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值