- 博客(5)
- 收藏
- 关注

原创 【2021.11.11更新】ROS机器人强化学习环境搭建(Ubuntu20.04 + ROS Noetic + OpenAI_ROS),以Turtlebot3为例,包含自定义训练任务环境
本文介绍了基于强化学习的turtlebot3自主导航学习环境,包括openai_ros的安装以及以其为基础创建自己的强化学习任务环境。
2021-06-25 15:30:32
8836
31
原创 【强化学习】OpenAI Gym 多线程环境的简单实现,适用于A2C、A3C等算法
本文介绍了OpenAI Gym多线程环境的实现方法。由于OpenAI Baselines提供的SubprocVecEnv类在使用时会有一些bug,本文用自己的方式对多线程环境进行简单实现。以Breakout为例,效果如图。图 1 多线程breakout环境训练过程...
2021-11-05 10:34:10
2124
原创 【文献翻译】综述:机器学习可解释性
原文链接:Review Study of Interpretation Methods for Future Interpretable Machine LearningAbstract近年来,黑箱模型因其精度高而得到迅速发展。平衡可解释性和准确性越来越重要。可解释性的缺乏严重限制了该模型在学术界和工业界的应用。尽管可解释的机器学习方法多种多样,但解释的视角和意义也各不相同。我们回顾了当前可解释的方法,并根据所应用的模型对其进行了划分。我们将其分为两类:具有自解释模型的可解释方法和具有外部协同解释的可解
2021-05-27 19:16:04
5159
原创 强化学习环境OpenAI Gym的运行、显示,以及保存成gif
如题,首先定义gym的环境,这里使用breakout游戏。可以输出该环境的观测空间、动作空间,以及每个动作代表的意义 ENV = 'Breakout-v0' env = gym.make(ENV) print(env.observation_space) print(env.action_space) print(env.unwrapped.get_action_meanings())输出为Box(0, 255, (210, 160, 3), uint8)D
2021-01-11 16:12:24
8219
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人