非合作博弈论:标准型博弈入门
1. 效用函数与博弈基础
在合理的偏好假设下,个体总会有想要最大化其期望值的效用函数。在不确定环境中,若个体知晓结果及其概率并能简洁表示,那么选择使期望效用最大化的行动在概念上较为直接。然而,当存在两个或更多追求效用最大化且相互影响的个体时,情况会变得复杂。
1.1 TCP 用户博弈示例
假设你和同事是仅有的互联网使用者,网络流量由 TCP 协议管理。TCP 有退避机制,正常实现会在拥塞时退避,而有缺陷的实现则不会。你有两种策略:C(使用正确实现)和 D(使用有缺陷的实现)。不同策略组合下的平均数据包延迟情况如下:
| | C | D |
| — | — | — |
| C | 双方平均数据包延迟 1ms(-1, -1) | 你延迟 4ms,同事无延迟(-4, 0) |
| D | 你无延迟,同事延迟 4ms(0, -4) | 双方平均数据包延迟 3ms(-3, -3) |
在这个博弈中,理性用户一次性面对此场景时,无论对方选择如何,都会选择 D。预先允许用户交流也不会改变结果。对于完全理性的个体,多次博弈时决策不变,但如果博弈次数无限或不确定,可能会选择 C。
1.2 标准型博弈的定义
标准型(战略型)是博弈论中最常见的战略交互表示方式。一个(有限、n 人)标准型博弈是一个三元组 (N, A, u),其中:
- N 是有限的 n 个玩家集合,用 i 索引;
- A = A1 × · · · × An,Ai 是玩家 i 可用的有限行动集合,向量 a = (a1, . . . , an) ∈ A 称为行动组合;
-
超级会员免费看
订阅专栏 解锁全文
717

被折叠的 条评论
为什么被折叠?



