13、正规形式博弈解概念的计算方法

正规形式博弈解概念的计算方法

1. 搜索启发式算法

在计算正规形式博弈的解概念时,枚举法是可行的,关键在于找到最快的搜索启发式方法。对SEM启发式算法进行小修改后,在一般情况下也很有效。具体做法是,颠倒支撑集大小和平衡性之间的字典序排序(SEM先按大小排序,再按平衡性排序;在n人博弈中,我们颠倒这个顺序)。这种启发式算法在实践中表现出色,优于之前讨论的算法。需要注意的是,随着玩家数量n的增加,平衡性和大小的排序对算法效率变得极为重要,但在两人博弈中,这种颠倒排序的表现并不比SEM差太多,因为平衡支撑集大小配置中最小的那个在排序中仍然会很早就出现。

2. 计算两人一般和博弈的最大最小和最小最大策略

在两人一般和博弈中,玩家i的最大最小策略是在假定另一个玩家j采取对i造成最大伤害的策略时,能最大化i最坏情况下收益的策略。玩家j针对i的最小最大策略就是这种造成最大伤害的策略。最大最小和最小最大策略可以在多项式时间内计算,因为它们对应于相关零和博弈中的纳什均衡策略。

以计算玩家1的最大最小策略为例,定义一个零和博弈G′ = ({1, 2}, A1 × A2, (u1, -u1)),其中玩家1的效用函数不变,玩家2的效用是玩家1效用的负值。根据最小最大定理,G′中玩家1的纳什均衡策略就是G′中玩家1的最大最小策略,且玩家1的最大最小策略与玩家2的效用函数无关,所以在G和G′中玩家1的最大最小策略相同。这样,在G中寻找最大最小策略的问题就转化为在G′这个两人零和博弈中寻找纳什均衡的问题,可以运用之前章节介绍的技术来解决。

计算最小最大策略的过程类似。可以利用最小最大定理证明,G′中玩家2的纳什均衡策略就是他在G中针对玩家1的最小最大策略。如果要计算玩家1的最小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值