博弈论与验证中的图上多人博弈解读
在验证场景中,系统或程序的交互往往是一个动态过程,并非像矩阵博弈那样的一次性交互。矩阵博弈及其扩展形式(如重复博弈)并不适合用于研究验证场景中玩家之间的交互,因为对于表示系统或程序而言,具有明确状态的模型更为有用。下面将详细介绍图上博弈模型,并探讨为何标准理论无法解决此类博弈问题,最后给出计算纳什均衡的一些结果和思路。
通用模型定义及关注问题
考虑基于两人博弈模型扩展的并发多人随机博弈模型,它是一个元组 $G = (V, v_{init}, P, \Sigma, \delta, (payoff_A) {A\in P})$,各参数含义如下:
- $V$:有限的顶点集。
- $v {init}$:初始顶点。
- $P$:有限的玩家集。
- $\Sigma$:有限的动作集。
- $\delta$:将给定顶点和动作元组(称为移动)关联到可能目标顶点的分布。
- $(payoff_A)_{A\in P}$:每个玩家 $A$ 的收益函数。
相关概念及定义如下:
- 移动 :$m = (m_A) {A\in P} \in \Sigma^P$ 被称为一个移动。
- 历史 :$G$ 中的历史 $\pi$ 是一个有限非空序列 $v_0v_1 \cdots v_h \in V^+$,满足对于每个 $1 \leq i \leq h$,存在 $m_i \in \Sigma^P$ 使得 $v {i - 1} \xrightarrow{m_i} v_i$。
-
图上多人博弈与纳什均衡分析
超级会员免费看
订阅专栏 解锁全文
115

被折叠的 条评论
为什么被折叠?



