强化学习记录——gym中各种环境信息查看


一、gym中所有可以用的模拟环境

from gym import envs
for env in envs.registry.all():
    print(env.id)

二、环境展示

import gym
env = gym.make('Pendulum-v0')
for i_episode in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break
env.close()

三、其他环境参数

import gym
env = gym.make('Pendulum-v0').unwrapped
print(env.action_space)  # 输出动作信息
#print(env.action_space.n)  # 输出动作个数
print(env.observation_space)  # 查看状态空间
print(env.observation_space.shape[0])  # 输出状态个数
print(env.observation_space.high)  # 查看状态的最高值
print(env.observation_space.low)  # 查看状态的最低值

四、各类环境

经典控制环境Classic control:入门

算法学习环境Algorithms

2D仿真环境Box2D

Mujoco环境

Atari

文本游戏环境Toy text

五、官网提供

gym入门、环境鸟瞰图:Gym

环境脚本:gym/gym/envs/classic_control at master · openai/gym · GitHub

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值