决策理论规划与传感不确定下的规划
在决策理论规划和传感不确定下的规划领域,存在许多有趣的概念和实际应用场景。下面将详细介绍相关内容。
1. 信息空间相关概念
信息空间(I - space)的基本概念可以追溯到Kuhn在博弈树方面的工作。在博弈论中,非确定性I - 状态被称为信息集,之后这一概念被引入随机控制理论。信息空间这一术语在序贯和微分博弈论中被广泛使用。在人工智能文献中,I - 状态被称为信念状态,在部分可观测马尔可夫决策过程(POMDPs)的研究中尤为重要。在控制理论的可观测性问题中也会产生I - 空间,在机器人学文献中,它们被称为超状态和知识状态。
2. 经典游戏中的I - 空间示例
- 战舰游戏
- 游戏规则 :这是一个在交替回合模型下的序贯游戏。两名玩家P1和P2各自在一个10×10的网格上秘密布置战舰。状态是每个玩家网格上所有战舰的确切位置,状态空间是两名玩家所有可能的战舰位置集合。玩家轮流猜测一个网格方块,可能的观测结果是“击中”和“未击中”,游戏直到一名玩家观测到所有战舰所在方块都被击中为止。
- 策略分析 :一旦发现“击中”,玩家应在附近搜索其他可能的“击中”,因为同一艘战舰会占据几个连续的方块。优秀的玩家会使用非确定性I - 状态来提高下一次击中的概率。
- 公主与怪物游戏
- 游戏规则 :这是一个来自博弈论的
超级会员免费看
订阅专栏 解锁全文
47

被折叠的 条评论
为什么被折叠?



