9、可扩展联盟形成的组织化学习方法

可扩展联盟形成的组织化学习方法

在多智能体系统中,智能体之间的合作可以带来诸多益处,例如多个机器人合作搬运重物、在短时间内清扫特定区域等。然而,随着智能体数量的增加,让所有智能体参与详细的协调/协商过程会限制系统的可扩展性。因此,先形成一个拥有足够资源来承担共同问题的智能体联盟,然后让联盟内的智能体进行协调和协商,是一种更优的选择。

1. 问题定义

为了专注于联盟形成问题,我们做出了一些简化假设以避免引入调度问题。我们假设时间被划分为多个回合,每个回合开始时,每个智能体都会收到一系列任务。一旦一个任务被分配给一个联盟,该联盟内的智能体在本回合结束前不能再被分配其他任务。回合结束后,所有智能体将被释放,准备分配下一回合的任务。

设 (T = (\tau_1, \tau_2, …, \tau_n)) 是一个回合中到达的任务序列,每个任务 (\tau_i) 由元组 ((u_i, r_{i,1}, r_{i,2}, …, r_{i,m})) 定义,其中 (u_i) 是完成任务 (\tau_i) 所获得的效用,(r_{i,k}) 是任务 (\tau_i) 所需的资源 (k) 的数量。设 (I = {I_1, I_2, …, I_n}) 是系统中的个体智能体集合,每个智能体 (I_j) 由元组 ((\sigma_{j,1}, \sigma_{j,2}, …, \sigma_{j,m})) 定义,其中 (\sigma_{j,k}) 是智能体 (I_j) 控制的资源 (k) 的数量。

联盟形成问题是找到一个任务子集 (S \subseteq T),在满足联盟约束的同时最大化效用,即:
- 存在一组联盟 (C = {C_1, …, C_{|S|}}),其中 (C_i

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值