7、非合作博弈论入门:标准形式的博弈

非合作博弈论入门:标准形式的博弈

1. 效用函数与博弈背景

在合理的偏好假设下,每个满足所需公理的偏好集合都存在效用函数。冯·诺伊曼和摩根斯坦还指出,效用函数在不同结果下的绝对值并不重要,对效用函数进行任何正仿射变换都会为同一主体产生另一个效用函数。即如果 $u(o)$ 是某主体的效用函数,那么 $u′(o) = au(o) + b$($a$、$b$ 为常数且 $a$ 为正)也是该主体的效用函数。

在不确定环境中,若结果及其概率已知且能简洁表示,主体只需选择最大化期望效用的行动。但当环境中有两个或更多追求效用最大化且行动相互影响的主体时,情况会变得复杂,这就需要借助博弈论来研究。

2. 标准形式博弈示例:TCP 用户博弈

假设你和同事是仅有的网络使用者,网络流量由 TCP 协议控制。TCP 有退避机制,若发送信息包导致网络拥塞,正确的实现会降低发送速率,有缺陷的则不会。你有两种策略:$C$(使用正确实现)和 $D$(使用有缺陷的实现)。不同策略组合下的结果如下表:
| | C | D |
| — | — | — |
| C | -1, -1 | -4, 0 |
| D | 0, -4 | -3, -3 |

从表中可知,若两人都选 $C$,平均数据包延迟为 1 毫秒;都选 $D$,延迟为 3 毫秒;一人选 $D$ 另一人选 $C$,选 $D$ 的无延迟,选 $C$ 的延迟为 4 毫秒。这里的数字,第一个代表你的收益(延迟的负值),第二个代表同事的收益。

博弈论表明,理性用户在单次博弈中会选 $D$,且事前沟通不改变结果。对于完全理性的主体,多次博弈决策不变,但博弈次数无限或不确定

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值