本专栏是强化学习运用在买卖股票之上的入门学习内容。
主要解决强化学习代码落地和代码实践,不需要学习相关数学原理,直观简单的带领读者入门强化学习炒股。
查看本专栏完整内容,请访问:https://blog.youkuaiyun.com/windanchaos/category_12391143.html
本文发布地址:https://blog.youkuaiyun.com/windanchaos/article/details/132202020
本章是强化学习的基础,需要至少理解Discrete
。
为什么要学习值类型
一句话,认识和学习action
的值以及observation观察值
(环境返回给agent的值)可取哪些非常重要,因为这是输入-输出
模型中负责输入和输出的部分,搞懂这个,我们便能更好的驾驭强化学习。
我们直接看源码(gym.space
目录下),并给出说明:
空间值简单描述是一个数学集,并在Gym中用于指定有效的动作和观察值。
每个Gym环境必须具有action_space
和observation_space
属性。