import-include-优快云博客

原创如何将在mujoco环境中实现DDPG输出的动作值映射到原本的动作空间

在gym的mujoco环境中测试DDPG算法时，会出现Actor网络输出的每个动作值在-1到1之间（如果输出层用的激活函数是tanh），但mujoco并不是所有的环境的动作值都是在[-1,1]之间，因此需要将输出的动作值映射到mujoco环境的动作区间。这其实就是数据的映射问题。首先我们要知道如何将数据归一化映射到任意区间：假设：a_n_max: 要映射的目标区间最大值a_n_mi...

2018-08-11 19:18:26 2195

原创 "AttributeError:module 'mujoco_py' has no attribute 'load_model_from_path''的解决方法

当安装好mujoco以及mujoco_py之后，我们自然会测试以下官网的测试程序，其中在使用“load_model_from_path”来加载模型时，我就出现了这样的错误："AttributeError:module 'mujoco_py' has no attribute 'load_model_from_path''因为之前在虚拟机装过mujoco_py,踩了很多坑，因此本能的觉得mujo...

2018-07-23 20:11:45 5813 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 如何将在mujoco环境中实现DDPG输出的动作值映射到原本的动作空间

原创 "AttributeError:module 'mujoco_py' has no attribute 'load_model_from_path''的解决方法

空空如也

空空如也

原创如何将在mujoco环境中实现DDPG输出的动作值映射到原本的动作空间