分布式优化与非合作博弈论:社会法则、效用理论与决策分析
1. 社会法则与惯例
社会法则是对个体策略的一种限制,以交通规则为例,城市交通官员虽无法重新设计汽车或建造新道路,但可制定交通规则来优化交通流量。交通规则禁止人们在道路左侧行驶或闯红灯,这对个体而言是一种权衡,个体虽失去一定自由,但能从他人失去部分自由中获益。一个好的社会法则旨在使所有个体受益。
从博弈论的角度来看,在一个博弈中,每个个体都有多种可能的策略(如交通中的驾驶计划),根据每个个体所选策略,每个个体都会获得一定的收益。有时个体利益相互冲突,有时则一致。在极端情况下,个体利益完全一致,唯一的问题是个体间的协调。交通就是一个很好的例子,只要大家都在同一侧行驶,个体在左侧或右侧行驶都会感到满意。
社会法则通过排除博弈中每个个体的某些策略,从而诱导出一个子博弈。当子博弈中每个个体只有一种策略时,我们称其为社会惯例。一个好的社会法则所诱导出的子博弈应比原博弈更受青睐,但“青睐”的概念有多种理解方式。
寻找好的社会法则或社会惯例是一个难题,一般来说,在合适的“好”的定义下,找到好的社会法则的问题是NP难的。不过,也有一些积极的方面:
- 存在一些限制条件可使问题变为多项式复杂度。
- 在特定情况下,可以手动制定好的社会法则。
1.1 机器人示例
假设有一组属于Deliverobot公司的k个机器人{0, 1, …, k - 1},它们要在连接七个地点的道路系统中导航,主要挑战是避免相互碰撞。这些机器人都从公司仓库s点出发,采用离散时间模型,每个机器人穿越任意一条边需要一个时间单位,也可选择更慢的速度。在最初的k个时间步中,每个时间步会派遣一个机
超级会员免费看
订阅专栏 解锁全文
1234

被折叠的 条评论
为什么被折叠?



