多智能体决策与概率编程的深度剖析
1. 多智能体决策基础
在多智能体环境中,当存在需要合作或竞争的其他智能体时,多智能体规划就显得尤为必要。联合计划虽可构建,但两个智能体若要就执行哪个联合计划达成一致,还需某种协调形式。
游戏理论用于描述多智能体交互场景中智能体的理性行为,它之于多智能体决策,就如同决策理论之于单智能体决策。游戏理论中的解决方案概念旨在刻画游戏的理性结果,即每个智能体都理性行事时可能出现的结果。
非合作游戏理论假定智能体必须独立做出决策,其中纳什均衡是最重要的解决方案概念。纳什均衡是一种策略组合,在该组合中,没有智能体有动机偏离其指定策略。我们有处理重复游戏和顺序游戏的技术。
合作游戏理论则考虑智能体可以达成有约束力的协议以形成联盟进行合作的情况。合作游戏中的解决方案概念试图确定哪些联盟是稳定的(核心),以及如何公平地分配联盟获得的价值(夏普里值)。
对于某些重要的多智能体决策类别,有专门的技术可用:
- 合同网用于任务共享。
- 拍卖用于有效分配稀缺资源。
- 谈判用于就共同利益事项达成协议。
- 投票程序用于聚合偏好。
2. 泽特恩谈判策略
泽特恩策略规定,每个智能体的首次提议应是谈判集中使其自身效用最大化的交易(可能不止一个)。在谈判的第 t 轮,应让步的智能体是风险值较小的那个,即如果双方都不让步,在冲突中损失最大的那个。
关于让步多少的问题,泽特恩策略的答案是“刚好足以改变风险平衡,使风险转移到另一方”。也就是说,智能体应做出最小的让步,以使另一方在下一轮让步。
该策略还有一个最终改进。若在某
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



