- 博客(2)
- 收藏
- 关注
原创 如何将在mujoco环境中实现DDPG输出的动作值映射到原本的动作空间
在gym的mujoco环境中测试DDPG算法时,会出现Actor网络输出的每个动作值在-1到1之间(如果输出层用的激活函数是tanh),但mujoco并不是所有的环境的动作值都是在[-1,1]之间,因此需要将输出的动作值映射到mujoco环境的动作区间。这其实就是数据的映射问题。首先我们要知道如何将数据归一化映射到任意区间:假设:a_n_max: 要映射的目标区间最大值a_n_mi...
2018-08-11 19:18:26
2195
原创 "AttributeError:module 'mujoco_py' has no attribute 'load_model_from_path''的解决方法
当安装好mujoco以及mujoco_py之后,我们自然会测试以下官网的测试程序,其中在使用“load_model_from_path”来加载模型时,我就出现了这样的错误:"AttributeError:module 'mujoco_py' has no attribute 'load_model_from_path''因为之前在虚拟机装过mujoco_py,踩了很多坑,因此本能的觉得mujo...
2018-07-23 20:11:45
5813
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人