基于多智能体Q学习的智能体网络自组织研究
1. 智能体网络模型
智能体网络的目标是将任务分配给智能体,以最小化智能体之间的通信成本并最大化完成任务所获得的收益。在该模型中,智能体网络由一组协作智能体组成,即 $A = {a_1, …, a_n}$,处于分布式任务分配环境中。任务环境呈现出连续动态的任务流,每个任务 $\Theta$ 由一组子任务组成,即 $\Theta = {θ_1, …, θ_m}$。每个子任务 $θ_i$ 需要特定的资源和一定的计算能力来完成,并且成功完成子任务的智能体将获得相应的收益。子任务 $θ_i$ 被建模为一个令牌 $\Delta_i$,可以在网络中传递以找到合适的智能体来完成。
智能体网络中有三种类型的邻居,即对等、从属和上级邻居,由对等和从属 - 上级两种关系构成。具体定义如下:
- 对等关系(Peer-to-Peer) :用“∼”表示($∼⊆A × A$),是一种兼容关系,具有自反性和对称性,即 $\forall a_i \in A : a_i ∼ a_i$ 且 $\forall a_i, a_j \in A : a_i ∼ a_j \Rightarrow a_j ∼ a_i$。
- 从属 - 上级关系(Subordinate - Superior) :用“≺”表示($≺⊆A × A$),是一种严格偏序关系,具有非自反性、非对称性和传递性,即 $\forall a_i \in A : ¬(a_i ≺ a_i)$,$\forall a_i, a_j \in A : a_i ≺ a_j \Rightarrow ¬(a_j ≺ a_i)$ 且 $\forall a_i, a_j
超级会员免费看
订阅专栏 解锁全文
1765

被折叠的 条评论
为什么被折叠?



