非合作博弈论:概念、策略与应用
在多智能体环境中进行决策时,博弈论起着至关重要的作用。本文将深入探讨非合作博弈论的关键概念、分析技术以及相关应用。
1. 约定与沟通在合作中的作用
在进行联合活动之前,采用约定是一种有效的协调方式。约定是对联合计划选择的一种约束,例如“坚守球场自己一侧”的约定能排除某些计划,使双方都选择特定计划。在道路行驶中,“靠右行驶”或“靠左行驶”的约定能解决车辆碰撞问题。在人类语言发展中,重要的不是个人说哪种语言,而是社区成员都说同一种语言。当约定广泛传播时,就形成了社会法则。
若没有约定,智能体可以通过沟通来达成对可行联合计划的共识。例如,网球运动员通过呼喊“我的!”或“你的!”来表明偏好的联合计划,也可以通过执行计划的第一部分来传达信息。这种协调方式被称为计划识别,当一个智能体的单个动作或短序列动作足以让另一个智能体明确联合计划时,该方法有效。
2. 单步博弈:标准型博弈
标准型博弈是一种所有玩家同时行动,游戏结果基于所选行动组合的博弈模型。其由三个要素定义:
- 玩家 :进行决策的智能体,常见的有两人博弈,也有多玩家博弈。
- 行动 :玩家可选择的动作,玩家的行动集可能相同也可能不同。
- 收益函数 :为每个玩家在所有玩家的行动组合下提供效用。对于两人博弈,收益函数可用矩阵表示,每个单元格标注了两个玩家的收益。
以两指猜拳游戏为例,两个玩家O和E同时展示一根或两根手指。若手指总数为奇数,O从E处获得相应金额;若为偶数,E从O处获得相应金额。其收益矩
超级会员免费看
订阅专栏 解锁全文
754

被折叠的 条评论
为什么被折叠?



