非合作博弈论入门:标准形式的博弈
1. 效用函数与博弈背景
在合理的偏好假设下,每个满足所需公理的偏好集合都存在效用函数。冯·诺伊曼和摩根斯坦还指出,效用函数在不同结果下的绝对值并不重要,对效用函数进行任何正仿射变换都会为同一主体产生另一个效用函数。即如果 $u(o)$ 是某主体的效用函数,那么 $u′(o) = au(o) + b$($a$、$b$ 为常数且 $a$ 为正)也是该主体的效用函数。
在不确定环境中,若结果及其概率已知且能简洁表示,主体只需选择最大化期望效用的行动。但当环境中有两个或更多追求效用最大化且行动相互影响的主体时,情况会变得复杂,这就需要借助博弈论来研究。
2. 标准形式博弈示例:TCP 用户博弈
假设你和同事是仅有的网络使用者,网络流量由 TCP 协议控制。TCP 有退避机制,若发送信息包导致网络拥塞,正确的实现会降低发送速率,有缺陷的则不会。你有两种策略:$C$(使用正确实现)和 $D$(使用有缺陷的实现)。不同策略组合下的结果如下表:
| | C | D |
| — | — | — |
| C | -1, -1 | -4, 0 |
| D | 0, -4 | -3, -3 |
从表中可知,若两人都选 $C$,平均数据包延迟为 1 毫秒;都选 $D$,延迟为 3 毫秒;一人选 $D$ 另一人选 $C$,选 $D$ 的无延迟,选 $C$ 的延迟为 4 毫秒。这里的数字,第一个代表你的收益(延迟的负值),第二个代表同事的收益。
博弈论表明,理性用户在单次博弈中会选 $D$,且事前沟通不改变结果。对于完全理性的主体,多次博弈决策不变,但博弈次数无限或不确定
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



