OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用
OpenAI、DeepMind,伯克利三个可以说是强化学习的推动者,其中OpenAI 为很多算法都写了baselines。本文讲开始运行例子,以A2C算法为例子(具体a2c算法原理后续讲解):
首先就是安装gym环境,具体直接参考OpenAI的github: https://github.com/openai/gym
本文使用了Atari游戏,那么在gym中需要安装,不然有的游戏可能不会默认安装:
pip install -e '.[atari]'
这是原话:The Atari environments are a variety of Atari video games. If you didn’t do the full install, you can install dependencies via pip install -e ‘.[atari]’ (you’ll need cmake installed) and then get started as follow:
import gym
env = gym.make('SpaceInvaders-v0'