多智能体系统中的分布式优化与Logit动态学习
1. 多智能体系统中的分布式优化
在某些情况下,优化问题自然地落入博弈论框架,但潜在博弈设计无法解决这些问题。例如,在一个多智能体系统中,智能体的成本取决于联合行动,它们的共同目标是最小化系统的总体成本。
以拥塞路由问题为例,有 $n$ 个智能体需要将一定量的数据从起点传输到终点。每个用户 $i$ 传输固定量 $x_i$ 的数据会获得一定的利润,用函数 $u_i(x_i)$ 表示;同时,需要支付一定的价格 $p_i(x)$,其中 $x = \sum_{j=1}^{n} x_j$ 是起点到终点的总拥塞量。因此,智能体 $i$ 的成本为:
[c_i(x) = c_i(x_1, \cdots, x_n) = p_i(\sum_{j=1}^{n} x_j) - u_i(x_i)]
智能体的共同目标是选择合适的行动 $x_i$,以最小化全局传输成本 $C(x) = \sum_{i=1}^{n} c_i(x)$。
这种问题是多智能体系统中分布式优化的一个特例。网络系统中的一般优化问题可以表述为:考虑一个由 $n$ 个智能体组成的网络,在每个时间 $t$,节点 $i$ 只能通过通信图与邻居进行通信。智能体的目标是解决以下最小化问题:
[\min_{z \in Z \subseteq R^d} F(z) = \sum_{i=1}^{n} F_i(z)]
其中 $F_i: R^d \to R$,一般情况下 $d \neq n$。这类问题在许多应用中经常出现,例如大数据分析中统计模型的总体损失函数优化。在很多应用中,关键的一点是函数 $F_i$ 只有智能体 $i$ 知道,因此智能体需要合作并交换关于最优联合行动的
超级会员免费看
订阅专栏 解锁全文
528

被折叠的 条评论
为什么被折叠?



