6、分布式优化与非合作博弈论：社会法则、效用理论与决策分析

最新推荐文章于 2025-09-22 11:11:24 发布

info6

最新推荐文章于 2025-09-22 11:11:24 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：多智能体系统：从理论到实践文章标签：分布式优化非合作博弈论社会法则

本文链接：https://blog.youkuaiyun.com/info6/article/details/150188239

多智能体系统：从理论到实践专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

分布式优化与非合作博弈论：社会法则、效用理论与决策分析

1. 社会法则与惯例

社会法则是对个体策略的一种限制，以交通规则为例，城市交通官员虽无法重新设计汽车或建造新道路，但可制定交通规则来优化交通流量。交通规则禁止人们在道路左侧行驶或闯红灯，这对个体而言是一种权衡，个体虽失去一定自由，但能从他人失去部分自由中获益。一个好的社会法则旨在使所有个体受益。

从博弈论的角度来看，在一个博弈中，每个个体都有多种可能的策略（如交通中的驾驶计划），根据每个个体所选策略，每个个体都会获得一定的收益。有时个体利益相互冲突，有时则一致。在极端情况下，个体利益完全一致，唯一的问题是个体间的协调。交通就是一个很好的例子，只要大家都在同一侧行驶，个体在左侧或右侧行驶都会感到满意。

社会法则通过排除博弈中每个个体的某些策略，从而诱导出一个子博弈。当子博弈中每个个体只有一种策略时，我们称其为社会惯例。一个好的社会法则所诱导出的子博弈应比原博弈更受青睐，但“青睐”的概念有多种理解方式。

寻找好的社会法则或社会惯例是一个难题，一般来说，在合适的“好”的定义下，找到好的社会法则的问题是NP难的。不过，也有一些积极的方面：
- 存在一些限制条件可使问题变为多项式复杂度。
- 在特定情况下，可以手动制定好的社会法则。

1.1 机器人示例

假设有一组属于Deliverobot公司的k个机器人{0, 1, …, k - 1}，它们要在连接七个地点的道路系统中导航，主要挑战是避免相互碰撞。这些机器人都从公司仓库s点出发，采用离散时间模型，每个机器人穿越任意一条边需要一个时间单位，也可选择更慢的速度。在最初的k个时间步中，每个时间步会派遣一个机

会员秒杀 ¥9.9 重磅福利

超级会员免费看