分布式最大团联盟形成算法解析
1. 问题背景与相关研究
在多智能体系统(MAS)中,分布式联盟形成以及任务和资源分配是重要的研究领域。有研究将分布式资源分配问题转化为分布式约束满足和/或优化(DCS/DCO)问题。不过,一些研究成果并不适用于大规模多智能体系统的建模框架。
例如,Modi等人的研究对各种分布式资源和/或任务分配问题进行了完整的形式化,并给出了与(动态)分布式约束满足或优化问题的一般映射,但他们研究中的智能体是严格合作的,共享相同目标,没有个体效用或偏好的概念。而在实际情况中,由于系统规模大、环境变化动态且不可预测,智能体没有关于环境的共享或全局知识,每个智能体对世界的可能(局部)状态有自己的个体偏好。通过将激励“编码”到个体智能体的行为函数中,利用激励工程方法可以使智能体相互协作。
2. 问题陈述与主要假设
本研究的主要目的是设计一个完全分布式、可扩展且高效的算法,供自主智能体集合在其协调策略中作为子程序使用,以有效地形成适度规模的临时联盟。
每个智能体都配备了一个内部资源或能力元组,元组中的每个条目都是非负实数。每个任务需要该元组中每个个体资源的一定非负量才能得到服务。单个智能体或两个以上智能体的联盟只有在其联合能力满足任务的资源消耗要求时,才能服务给定任务。
该分布式最大团联盟形成算法的应用需要满足以下基本假设:
- 智能体之间通过本地广播或点对点方式交换消息进行通信。
- 假设通信带宽足够。
- 每个智能体有足够的本地内存(包括消息缓冲区)来存储从其他智能体接收到的所有信息。
- 联盟形成期间通信可靠,即如果智能体A向智能体B发送消息,那么智能体B要么收到