7、非合作博弈论入门：标准形式的博弈

info6

于 2025-06-22 10:03:00 发布

阅读量67

点赞数

CC 4.0 BY-SA版权

分类专栏：多智能体系统：从理论到实践文章标签：非合作博弈论标准形式博弈效用函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/info6/article/details/150188248

多智能体系统：从理论到实践专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

非合作博弈论入门：标准形式的博弈

1. 效用函数与博弈背景

在合理的偏好假设下，每个满足所需公理的偏好集合都存在效用函数。冯·诺伊曼和摩根斯坦还指出，效用函数在不同结果下的绝对值并不重要，对效用函数进行任何正仿射变换都会为同一主体产生另一个效用函数。即如果 $u(o)$ 是某主体的效用函数，那么 $u′(o) = au(o) + b$（$a$、$b$ 为常数且 $a$ 为正）也是该主体的效用函数。

在不确定环境中，若结果及其概率已知且能简洁表示，主体只需选择最大化期望效用的行动。但当环境中有两个或更多追求效用最大化且行动相互影响的主体时，情况会变得复杂，这就需要借助博弈论来研究。

2. 标准形式博弈示例：TCP 用户博弈

假设你和同事是仅有的网络使用者，网络流量由 TCP 协议控制。TCP 有退避机制，若发送信息包导致网络拥塞，正确的实现会降低发送速率，有缺陷的则不会。你有两种策略：$C$（使用正确实现）和 $D$（使用有缺陷的实现）。不同策略组合下的结果如下表：
| | C | D |
| — | — | — |
| C | -1, -1 | -4, 0 |
| D | 0, -4 | -3, -3 |

从表中可知，若两人都选 $C$，平均数据包延迟为 1 毫秒；都选 $D$，延迟为 3 毫秒；一人选 $D$ 另一人选 $C$，选 $D$ 的无延迟，选 $C$ 的延迟为 4 毫秒。这里的数字，第一个代表你的收益（延迟的负值），第二个代表同事的收益。

博弈论表明，理性用户在单次博弈中会选 $D$，且事前沟通不改变结果。对于完全理性的主体，多次博弈决策不变，但博弈次数无限或不确定

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。