使用mujoco加载模型和控制、以及训练(一)

MuJoCo环境配置与训练入门

首先是准备环境的过程,我们这里直接在windows下准备环境和训练
我们以b站视频
在这里插入图片描述
顺便说一下,这个熟悉的公式,末端执行器的速度信息是由各关节的速度信息以及一个雅可比矩阵决定的,行是末端执行器的6维速度,列是关节的速度信息(1个关节当然只有一个确定的运动!!)
在这里插入图片描述

环境准备

安装mujoco

下载安装mujoco,直接下载的最新版本的mujoco进行使用。
https://github.com/google-deepmind/mujoco/releases
在这里插入图片描述
然后添加环境变量的信息:
在这里插入图片描述
在这里插入图片描述
以及在Path中添加
在这里插入图片描述

安装cuda和cudnn

我们默认是安装了nvidia-smi的驱动了的,这里就从cuda和cudnn的安装开始吧。不过对于强化学习来说,cpu和gpu训练区别不大。
安装conda然后创建一个虚拟的python环境。
然后安装cuda和cudnn:
https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive
我选择的是cuda-11.8的版本,安装cuda时,直接运行exe即可(如果出现CRC error的问题,改用network的安装形式),注意选择自己需要安装的目录下。
在这里插入图片描述

然后把cudnn的文件放入cuda的安装目录下:
下载 cuDNN
访问cuDNN 归档页,登录 NVIDIA 开发者账号(无账号需注册,免费)。
选择与 CUDA 匹配的版本:例如cuDNN v8.9.2 for CUDA 11.x,下载 Windows 版本(cudnn-windows-x86_64-8.9.2.26_cuda11-archive.zip)。
解压并复制文件
解压下载的 zip 包,得到cudnn-windows-x86_64-8.9.2.26_cuda11-archive文件夹,内部包含bin、include、lib三个子文件夹。
将这三个文件夹复制到 CUDA 安装目录(默认C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8),覆盖同名文件夹(若提示 “合并” 或 “替换”,选择 “是”)。
验证 cuDNN 安装
检查 CUDA 目录下是否存在以下文件(说明复制成功):
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin\cudnn64_8.dll
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\include\cudnn.h
在这里插入图片描述

接下来是torch等基础环境:

pip install stable_baselines3[extra] mujoco

卸载cpu版本的torch:

pip uninstall torch torchvision torchaudio

安装cuda版本

pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple/ --extra-index-url https://download.pytorch.org/whl/cu118

最后直接开始训练即可:

python train_robot_arm.py

在这里插入图片描述
等到训练完成后我们测试一下模型即可。

这个比较简单,我们学习到的mujoco的操作不多。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白云千载尽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值