8、概念图规则、模式刺激与博弈状态推理

概念图规则、模式刺激与博弈状态推理

1. 博弈状态推理规则

在博弈场景中,为了从状态的后继状态推导出当前状态的状态,需要用到特定的规则。对于给定的状态,游戏的状态可以是平局或者某一玩家获胜。状态信息在终端状态(即根据结束规则确定的可能状态树的叶子节点)中初始化,然后从叶子节点递归计算到可能状态树的根节点。

1.1 状态推导规则

  • 获胜状态规则 :对于状态 S,如果存在一个直接后继状态,其中 S 的当前玩家是获胜者,那么 S 就是其当前玩家的获胜状态。因为无论另一个玩家做什么,该玩家都有获胜的方法。
  • 平局状态规则 :如果存在一个直接后继状态,游戏状态为平局,且当前玩家尚未确保获胜,那么状态 S 的状态为平局。因为玩家至少可以确保平局。
  • 失败状态规则 :如果当前玩家既不能获胜也不能获得平局,那么 S 就是当前玩家的失败状态。

1.2 规则应用结果

应用这些规则会得到一个唯一的扩展,在这个扩展中可以轻松找到玩家在游戏任何状态下的最佳玩法。由于只有一个扩展,怀疑推理和轻信推理是等价的。这个扩展包含 26830 种不同的游戏可能状态,但这个庞大的搜索树没有考虑到一些状态在反射和旋转下是等价的情况。

要确定在某一状态下是否有最佳玩法,可以在扩展中查找当前玩家是否通过“获胜”关系与初始状态相连。如果是,则可以通过搜索初始状态的一个后继状态,找到玩家获胜的一种最佳玩法。

1.3 示例表格

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值