基于图形博弈的分布式约束优化问题算法家族
1 引言
分布式约束优化问题(DCOP)是一种实用的形式化方法,适用于分布式智能体各自控制一些变量,试图优化一个全局目标函数的场景。这个全局目标函数是分布式约束效用函数的聚合。DCOP可应用于许多多智能体领域,如传感器网络、分布式航天器、灾难救援模拟和软件个人助理智能体等。
随着这些领域的规模不断扩大,当前的完备算法会产生巨大的计算成本。例如,一个大规模的个人助理智能体网络,需要对数百个智能体和数千个变量进行DCOP全局优化,这目前是非常昂贵的。而如果让每个智能体或变量根据其对邻居和约束效用的局部知识做出反应,就能创建一个无需基于树的通信结构的系统,该系统易于扩展,并且对动态环境更具鲁棒性。
研究人员最初为分布式约束满足问题(Distributed CSPs)引入了DBA和DSA算法,后来将其扩展到具有加权约束的DCOPs。我们将这些称为无协调或1 - 协调算法。虽然已有对这些1 - 协调算法在DCOPs上的详细实验分析,但我们仍缺乏理论工具来理解这些算法在任意DCOP问题上的演化和性能。本文的主要贡献是将DCOP分解为一个等效的图形博弈,为分析1 - 协调算法提供了框架,并提出了向k - 协调算法的演化,即一组k个智能体在单个协商回合中协调其行动。
2 DCOP:分布式约束优化
我们从分布式约束优化问题的形式化表示开始。设$V = {v_i}_{i\in\mathbb{N}}$表示一组变量,每个变量$v_i$可以取一个值$v_i = x_i \in X_i$,其中$i \in \mathbb{N} = {1, \cdots, N}$,$X_i$是一个具有有限基数$M_i \in \mathbb
基于图形博弈的DCOP算法家族研究
超级会员免费看
订阅专栏 解锁全文
483

被折叠的 条评论
为什么被折叠?



