55、双线性博弈:基于秩的子类多项式时间算法

双线性博弈:基于秩的子类多项式时间算法

1. 双线性博弈与纳什均衡

在双线性博弈的研究中,我们需要先明确一些基础的符号表示。默认情况下,向量 $x$ 被视为列向量,其行向量表示为 $x^T$。若 $x \in \mathbb{R}^n$ 是向量,$c \in \mathbb{R}$ 是标量,$x \leq c$ 意味着对于所有 $i \leq n$,都有 $x_i \leq c$。对于给定矩阵 $A$,其第 $i$ 行和第 $j$ 列分别表示为 $A_i$ 和 $A_j$,并且 $|A| = \max_{ij} |A_{ij}|$。

双线性博弈是一种两人非合作、单次博弈,由两个 $M \times N$ 维的收益矩阵 $A$ 和 $B$(分别对应两个玩家)以及两个紧凑的多面体策略集来表示。设 $S_1 = {1, \ldots, M}$ 为矩阵的行集合,$S_2 = {1, \ldots, N}$ 为矩阵的列集合。矩阵 $E \in \mathbb{R}^{k_1 \times M}$ 和 $F \in \mathbb{R}^{k_2 \times N}$,向量 $e \in \mathbb{R}^{k_1}$ 和 $f \in \mathbb{R}^{k_2}$。第一个玩家的策略集为 $X = {x \in \mathbb{R}^M | Ex = e, x \geq 0}$,第二个玩家的策略集为 $Y = {y \in \mathbb{R}^N | Fy = f, y \geq 0}$,且集合 $X$ 和 $Y$ 被假定为紧凑的。

从策略组合 $(x, y) \in X \times Y$ 中,第一个玩家和第二个玩家获得的收益分别为 $x^T Ay$ 和 $x^T By$。纳什

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值