对称双矩阵博弈的可近似性及相关实验
1. 二次规划与KKT点
在带有线性约束的二次规划问题中,存在一个著名的性质:$kkt(QP) = sta(QP)$。这一性质在双矩阵博弈的纳什均衡(NE)点研究中十分有趣,因为它确保了Tsaknakis和Spirakis提出的下降法所针对的驻点,实际上就是我们即将提出的对称博弈二次规划公式(或Mangasarian和Stone提出的一般博弈公式)的KKT点。
2. 通过精确KKT点近似NE点
2.1 关键观察
- 任何对称双矩阵博弈$\langle A, B\rangle = \langle S, S^T\rangle$至少有一个对称纳什均衡(SNE)点。
- 对于对称策略组合,不仅两个玩家的收益相同,而且他们面对对手的收益向量也相同,即两个玩家在对称策略组合下的后悔值相同。对于任意$S \in [0, 1]^{n\times n}$和$z \in \Delta^n$,有:
- 共同收益:$z^T Bz = z^T S^T z = z^T Sz = z^T Az$
- 共同收益向量:$Az = Sz = (S^T)^T z = B^T z$
2.2 二次规划问题(SMS)
我们使用的二次规划问题是对Mangasarian和Stone的程序的改编:
- 目标函数:
- 最小化$f(s, z) = s - z^T Sz = s - \frac{1}{2}z^T Qz$
- 约束条件:
- $-1s + Sz \le
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



