gym,mujoco,baselines安装踩坑

本文详细介绍了在Ubuntu18环境下,如何安装gym、mujoco、mujoco_py以及baselines。建议使用Anaconda创建环境,并参考特定教程进行安装。特别提示,使用pip3而非pip解决某些安装问题,以及在安装mujoco_py时需创建目录并设置权限。同时,文中提供了可靠安装ROS的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

gym,mujoco,mujoco_py,baselines安装小技巧

参考教程地址:https://zhuanlan.zhihu.com/p/103271894

anaconda 下载地址为清华源,https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/,我使用的版本为3.5.1.0

tips:

1.推荐使用anaconda 安装环境后再根据github deepassist进行修改。原因是因为deepassist所使用的几个安装包版本依赖项版本不一致很容易出现bug。

2.推荐使用ubuntu18来进行安装,因为ubuntu18自带python3.6,可以避免修改默认python的问题

3.教程中所有的包均推荐使用pip3代替pip,进行安装,尤其当错误报告中出现—use--future--2020--version,经测试使用pip3可解决问题。

4.mujoco_py推荐进入~目录后 mkdir命令创建目录,在这之前可能需要chmod命令授予root权限&#

### 创建自定义 MuJoCo 环境 为了在 OpenAI Gym 中使用 MuJoCo 创建自定义环境,需遵循特定的结构和配置方法。以下是详细的指南: #### 安装依赖项 确保已安装 Python 和 pip 工具链,并验证其版本正确无误[^3]。 ```bash pip install mujoco-py==2.0.2.9 gym[all] ``` #### 准备 XML 文件 MuJoCo 使用 XML 文件来描述物理模型。对于复杂的物体如剪刀,可能需要调整默认设置以防止不期望的行为发生,比如穿透表面现象[^4]。 ```xml <!-- pick_and_place.xml --> <mujoco> <worldbody> <!-- Define scissors here instead of a simple cube --> <body name="scissors" pos="0 0 1"> <geom type="mesh" mesh="scissors_mesh"/> </body> </worldbody> </mujoco> ``` #### 编写 Python 类实现环境逻辑 继承 `gym.Env` 并重载必要的函数,例如 `_reset()` 和 `_step()`. 下面是一个简单的例子展示如何加载上述 XML 文件并初始化环境: ```python import os from gym import utils, spaces from gym.envs.mujoco import mujoco_env class CustomEnv(mujoco_env.MujocoEnv, utils.EzPickle): def __init__(self): xml_path = os.path.join(os.path.dirname(__file__), 'assets', 'pick_and_place.xml') super().__init__(xml_path, frame_skip=5) # 设置动作空间与观察空间 self.action_space = spaces.Box(low=-1.0, high=1.0, shape=(n_actions,)) self.observation_space = spaces.Box(-high, high) def step(self, action): ... return obs, reward, done, info def reset_model(self): ... return self._get_obs() ``` 通过这种方式可以在 OpenAI Gym 中成功集成 MuJoCo 物理引擎,从而构建更加真实的机器人仿真场景[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值