第2章 马尔科夫决策过程
2.3基于gym的MDP实例讲解
在运行本节实例的程序是,出现了一些错误,原因可能是作者使用的Python版本与自己使用的不一致,所以返回了一些错题,经过测试,可以做出以下修改:(两个函数定义形式)
在grid_mdp.py文件中,函数定义的原形式如下
def _step(self,action):
---snip---
def _reset(self):
---snip---
需要将step和reset前的横线 _ 去掉,之后可以正常运行
如果返回缺少 gym 模块,可以先执行 import gym,再执行之后的程序即可。