强化学习:OpenAI Gym与深度Q网络实践
1. 环境创建平台概述
在强化学习中,有许多平台可用于创建训练环境,以下是一些流行的平台:
- OpenAI Gym :包含一系列可用于训练强化学习(RL)智能体的环境,本文将使用其接口。
- Unity ML - Agents SDK :允许开发者将使用Unity编辑器创建的游戏和模拟转换为可通过简单Python API使用深度强化学习(DRL)、进化策略或其他机器学习方法训练智能体的环境。它与TensorFlow配合使用,可用于2D/3D和VR/AR游戏的智能体训练。更多信息可查看:https://github.com/Unity - Technologies/ml - agents 。
- Gazebo :可构建基于物理模拟的三维世界。gym - gazebo工具包结合了Gazebo、机器人操作系统(ROS)和OpenAI Gym接口,用于训练RL智能体。详情可参考白皮书:https://arxiv.org/abs/1608.05742 。
- Blender学习环境 :是Blender游戏引擎的Python接口,也可与OpenAI Gym配合使用。它基于免费的3D建模软件Blender,其集成的游戏引擎提供了创建游戏的强大工具。可创建自定义虚拟环境来训练RL智能体解决特定问题,相关信息:https://github.com/LouisFoucard/gym - blender 。
- Malmo :由微软团队构建,是基于Mine
超级会员免费看
订阅专栏 解锁全文
930

被折叠的 条评论
为什么被折叠?



