54、决策理论规划中的博弈策略解析

决策理论规划中的博弈策略解析

在决策理论规划的领域中,博弈论是一个重要的研究方向,它涵盖了零和博弈与非零和博弈等多种类型。下面将详细探讨这些博弈类型的特点、策略以及相关的计算方法。

零和博弈中的鞍点问题

在零和博弈里,鞍点是一个关键概念。一个矩阵可能存在不止一个鞍点,虽然这乍一看似乎会导致玩家之间的协调问题,但实际上,无论每个玩家选择哪个鞍点,他们都会得到相同的值,所以不会产生问题。

例如,有这样一个矩阵博弈:
[
\begin{array}{c|ccc}
V & 3 & 3 & 5 \
\hline
U & 1 & -1 & 7 \
& 0 & -2 & 4 \
\end{array}
]
通过特定方法(如应用相关公式或参考特定图形),可以得出当 (u = 3) 且 (v = 3) 时存在鞍点,此时 (L^* = 4)。在游戏结束后,双方玩家都不会有遗憾,因为对于玩家 P1 来说,在玩家 P2 选择第三列的情况下,4 是其可能获得的最低成本;对于玩家 P2 而言,在玩家 P1 选择最后一行的情况下,4 是其可能获得的最高成本。

若同一游戏中存在多个鞍点,情况会如何呢?实际上,如果存在多个鞍点,那么至少会有四个。例如下面这个矩阵博弈:
[
\begin{array}{c|ccccc}
V & 4 & 3 & 5 & -3 & 0 \
\hline
U & 1 & 2 & -1 &

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值