55、决策理论规划与效用理论解析

决策理论规划与效用理论解析

1. 非零和博弈中的纳什均衡

在博弈论中,非零和博弈是一种常见的情况。对于某些非零和博弈问题,其纳什均衡可能是双方合作,例如会得到 (8, 8) 的结果。但如果双方无法进行沟通和协调策略,就会为此付出代价。这种合作的解同时也是玩家的安全策略,因为在最坏情况分析下,它能实现最低成本。

1.1 随机化纳什均衡

当一个博弈在确定性策略空间中不存在纳什均衡时,可以通过扩展策略空间,将随机化策略纳入其中来缓解这个问题。Nash 证明了在特定表述下的每个非零和博弈都存在随机化纳什均衡。然而,这里存在一些问题。一方面,可能存在其他可接受的均衡,这意味着除非玩家进行合作,否则没有可靠的方法来避免遗憾。另一方面,随机化纳什均衡不能使用之前求解零和博弈鞍点的线性规划方法来计算,而是需要进行非线性规划。

对于一对随机化策略 (w, z),期望成本 $\overline{L} 1(w, z)$ 和 $\overline{L}_2(w, z)$ 可以通过特定公式计算。若一对策略 $(w^ , z^ )$ 满足以下条件,则被称为随机化纳什均衡:
- $\overline{L}_1(w^ , z^ ) = \min
{w\in W} {\overline{L}_1(w, z^ )}$
- $\overline{L}_2(w^
, z^ ) = \min_{z\in Z} {\overline{L}_2(w^ , z)}$

使用成本矩阵 A 和 B,纳什均衡条件可以写成:
- $w^ Az^

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值