一、选择框架
RL方面学习框架和平台很多,比较出名的有DeepMind的 Control Suite,OpenAI的 Gym 和 MuJoCo,以及Roboschool、PyBullet等等。
模型和算法依赖于后端使用的库有numpy, tensorflow, keras, pytorch等等。
作为一个初学者,我选则比较常用的OpenAI的 Gym 和 MuJoCo作为环境,Python 2.7 or 3.5以上都可以。在Linux上测试会比较稳定,Windows折腾一下也行。
安装Gym:
# 不翻墙可能速度会比较慢
pip install gym
# 用清华镜像下载
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gym
MuJoCo安装过程:mujoco win7下载安装
另外,OpenAI出品了强化学习 (RL) 入门教程,叫Spinning Up。
完全没有机器学习基础的人类,也可以迅速上手强化学习。有实战,有论文,有习题,帮你从入门到精通。
地址:Spinning Up
二、认识Gym
Gym是OpenAI的开源测试平台,可以从官方文档了解一下gym
Gym主要有以下几个环境:
-
经典控制和玩具文字:完成小规模任务,大部分来自RL文献。 他们是来帮助您入门的。
<

本文介绍强化学习的基础概念,选取OpenAI的Gym和MuJoCo作为学习框架,详细解析Gym环境如CartPole-v1的使用,包括环境安装、基本代码示例及观察值与动作空间的理解。
最低0.47元/天 解锁文章
15万+

被折叠的 条评论
为什么被折叠?



