64、非合作博弈论：概念、策略与应用

最新推荐文章于 2025-10-10 21:56:40 发布

rust6ferris

最新推荐文章于 2025-10-10 21:56:40 发布

阅读量31

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能：现代方法精解文章标签：非合作博弈论纳什均衡囚徒困境

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/rust6ferris/article/details/151887375

人工智能：现代方法精解专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

非合作博弈论：概念、策略与应用

在多智能体环境中进行决策时，博弈论起着至关重要的作用。本文将深入探讨非合作博弈论的关键概念、分析技术以及相关应用。

1. 约定与沟通在合作中的作用

在进行联合活动之前，采用约定是一种有效的协调方式。约定是对联合计划选择的一种约束，例如“坚守球场自己一侧”的约定能排除某些计划，使双方都选择特定计划。在道路行驶中，“靠右行驶”或“靠左行驶”的约定能解决车辆碰撞问题。在人类语言发展中，重要的不是个人说哪种语言，而是社区成员都说同一种语言。当约定广泛传播时，就形成了社会法则。

若没有约定，智能体可以通过沟通来达成对可行联合计划的共识。例如，网球运动员通过呼喊“我的！”或“你的！”来表明偏好的联合计划，也可以通过执行计划的第一部分来传达信息。这种协调方式被称为计划识别，当一个智能体的单个动作或短序列动作足以让另一个智能体明确联合计划时，该方法有效。

2. 单步博弈：标准型博弈

标准型博弈是一种所有玩家同时行动，游戏结果基于所选行动组合的博弈模型。其由三个要素定义：
- 玩家：进行决策的智能体，常见的有两人博弈，也有多玩家博弈。
- 行动：玩家可选择的动作，玩家的行动集可能相同也可能不同。
- 收益函数 ：为每个玩家在所有玩家的行动组合下提供效用。对于两人博弈，收益函数可用矩阵表示，每个单元格标注了两个玩家的收益。

以两指猜拳游戏为例，两个玩家O和E同时展示一根或两根手指。若手指总数为奇数，O从E处获得相应金额；若为偶数，E从O处获得相应金额。其收益矩

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。