Lesson 20.
1. POMDP : partially observable Markov decision processes
2. pegasus policy search: A policy search method for large MDPs and POMDPs
http://vorlon.case.edu/~sray/mlrg/pegasus.pdf
本文介绍了部分可观测马尔可夫决策过程(POMDP)及其在复杂决策问题中的应用,并详细探讨了一种名为Pegasus的策略搜索方法,该方法适用于大规模的马尔可夫决策过程(MDP)及POMDP。
Lesson 20.
1. POMDP : partially observable Markov decision processes
2. pegasus policy search: A policy search method for large MDPs and POMDPs
http://vorlon.case.edu/~sray/mlrg/pegasus.pdf
4511

被折叠的 条评论
为什么被折叠?