7、非合作博弈论：标准型博弈入门

sun99

于 2025-09-23 16:16:40 发布

阅读量20

点赞数

CC 4.0 BY-SA版权

分类专栏：多智能体系统的智慧博弈文章标签：非合作博弈论标准型博弈效用函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sun99/article/details/154717810

多智能体系统的智慧博弈专栏收录该内容

57 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

非合作博弈论：标准型博弈入门

1. 效用函数与博弈基础

在合理的偏好假设下，个体总会有想要最大化其期望值的效用函数。在不确定环境中，若个体知晓结果及其概率并能简洁表示，那么选择使期望效用最大化的行动在概念上较为直接。然而，当存在两个或更多追求效用最大化且相互影响的个体时，情况会变得复杂。

1.1 TCP 用户博弈示例

假设你和同事是仅有的互联网使用者，网络流量由 TCP 协议管理。TCP 有退避机制，正常实现会在拥塞时退避，而有缺陷的实现则不会。你有两种策略：C（使用正确实现）和 D（使用有缺陷的实现）。不同策略组合下的平均数据包延迟情况如下：
| | C | D |
| — | — | — |
| C | 双方平均数据包延迟 1ms（-1, -1） | 你延迟 4ms，同事无延迟（-4, 0） |
| D | 你无延迟，同事延迟 4ms（0, -4） | 双方平均数据包延迟 3ms（-3, -3） |

在这个博弈中，理性用户一次性面对此场景时，无论对方选择如何，都会选择 D。预先允许用户交流也不会改变结果。对于完全理性的个体，多次博弈时决策不变，但如果博弈次数无限或不确定，可能会选择 C。

1.2 标准型博弈的定义

标准型（战略型）是博弈论中最常见的战略交互表示方式。一个（有限、n 人）标准型博弈是一个三元组 (N, A, u)，其中：
- N 是有限的 n 个玩家集合，用 i 索引；
- A = A1 × · · · × An，Ai 是玩家 i 可用的有限行动集合，向量 a = (a1, . . . , an) ∈ A 称为行动组合；
-

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。