普遍问题
step function和reset function执行顺序
- ResetFunc (-1 Episode)
- StepFunc (0 step)
- ResetFunc (0 Episode)
- ResetFunc (1 Episode)
- StepFunc (1 step)
Discrete Action Space
当actions组合较少时,可以不用预分配cell空间,可以动态添加cell的数量或cell里的元素;
当actions的组合较多时,以递增方式动态增加cell的数量或元胞中元素的数量会导致 Out of Memory,需要预分配空间;
当actions的组合非常多时,预分配cell空间也会导致Out of Memory。
相关问题1: link.
相关问题2: