55、决策理论规划深度解析

决策理论规划深度解析

1. 非零和博弈中的纳什均衡

在博弈问题中,纳什均衡是一个重要的概念。对于某些问题,如两个参与者的情况,纳什均衡可能是双方合作,结果为 (8, 8) 。但如果双方无法沟通和协调策略,就会为此付出代价。这种解决方案同时也是参与者的安全策略,因为它通过最坏情况分析实现了最低成本。

1.1 随机化纳什均衡

当一个博弈在确定性策略空间中不存在纳什均衡时,可以通过扩展策略空间,引入随机化策略来解决。每个零和博弈在随机化策略空间中都有一个随机化鞍点,而每个非零和博弈也都存在随机化纳什均衡。不过,这也存在一些问题。一方面,可能存在其他可接受的均衡,这意味着除非参与者进行合作,否则无法可靠地避免遗憾;另一方面,随机化纳什均衡不能使用线性规划方法计算,而需要非线性规划。

随机化策略的期望成本可以通过特定公式计算。对于一对随机化策略 (w, z) ,期望成本 $\overline{L} 1(w, z)$ 和 $\overline{L}_2(w, z)$ 可以用 (9.57) 计算。一对策略 $(w^ , z^ )$ 被称为随机化纳什均衡,需满足以下条件:
$\overline{L}_1(w^ , z^ ) = \min
{w \in W} {\overline{L}_1(w, z^ )}$ (9.71)
$\overline{L}_2(w^
, z^ ) = \min_{z \in Z} {\overline{L}_2(w^ , z)}$ (9.72)

使用成本矩阵 A 和 B ,纳什均衡条件可以写成: <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值