双线性博弈:基于秩的子类多项式时间算法
1. 双线性博弈与纳什均衡
在双线性博弈的研究中,我们需要先明确一些基础的符号表示。默认情况下,向量 $x$ 被视为列向量,其行向量表示为 $x^T$。若 $x \in \mathbb{R}^n$ 是向量,$c \in \mathbb{R}$ 是标量,$x \leq c$ 意味着对于所有 $i \leq n$,都有 $x_i \leq c$。对于给定矩阵 $A$,其第 $i$ 行和第 $j$ 列分别表示为 $A_i$ 和 $A_j$,并且 $|A| = \max_{ij} |A_{ij}|$。
双线性博弈是一种两人非合作、单次博弈,由两个 $M \times N$ 维的收益矩阵 $A$ 和 $B$(分别对应两个玩家)以及两个紧凑的多面体策略集来表示。设 $S_1 = {1, \ldots, M}$ 为矩阵的行集合,$S_2 = {1, \ldots, N}$ 为矩阵的列集合。矩阵 $E \in \mathbb{R}^{k_1 \times M}$ 和 $F \in \mathbb{R}^{k_2 \times N}$,向量 $e \in \mathbb{R}^{k_1}$ 和 $f \in \mathbb{R}^{k_2}$。第一个玩家的策略集为 $X = {x \in \mathbb{R}^M | Ex = e, x \geq 0}$,第二个玩家的策略集为 $Y = {y \in \mathbb{R}^N | Fy = f, y \geq 0}$,且集合 $X$ 和 $Y$ 被假定为紧凑的。
从策略组合 $(x, y) \in X \times Y$ 中,第一个玩家和第二个玩家获得的收益分别为 $x^T Ay$ 和 $x^T By$。纳什
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



