分布式约束优化问题(DCOP):原理、应用与求解技术
1. 分布式约束优化问题概述
在分布式约束优化问题(DCOP)中,多个智能体分别控制部分变量 $X_i \subseteq X$,且每个变量仅分配给一个智能体,变量分配需构成集合 $X$ 的一个划分。智能体只能控制分配给自己的变量,即观察和改变这些变量的值,并且仅知晓涉及自身可控变量的约束,这些约束被称为局部函数,局部函数之和即为智能体的局部效用。若两个智能体间存在依赖各自可控变量的约束,则它们互为邻居,且只有邻居智能体可直接通信。
智能体的目标是找到约束网络的最优解,即找到系统中所有变量的赋值,以优化全局函数。在标准 DCOP 设定中,智能体不追求自身利益,而是致力于优化全局函数。
寻找 DCOP 的最优解是一个 NP 难题,可通过将 DCOP 归约为图的 3 - 可着色性问题(已知的 NP 完全问题)来证明。
2. 应用与基准测试问题
2.1 现实世界应用
许多现实应用都可使用 DCOP 框架建模,以下介绍两个常见应用场景:
- 会议调度 :在大型组织中,安排会议是常见且重要的问题。人们对会议开始时间可能有私人偏好,目标是在满足硬约束(如参会人员的会议不能重叠)的前提下,达成有效的会议安排,同时最大化个人偏好之和。
- DCOP 形式化 :用一组智能体代表参会人员,一组变量代表会议可能的开始时间。约束确保同一会议在不同智能体处的开始时间一致,且同一智能体的不同会议开始时间不重叠。偏好可表示为会议开始时间的软约束,整体目标是优化所有软约束之和。
-
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



