多智能体规划、控制与执行全解析
1. 引言
规划对于智能体至关重要,因为其当前和即将做出的行动选择,可能有意地促成,也可能意外地破坏后续行动达成理想世界状态所需的条件。在单智能体系统中,规划主要关注智能体如何高效地建模并从不同的行动序列中进行选择,且最好无需考虑每一种可能的序列。
而在多智能体环境下,情况变得更为复杂。一个智能体对近期行动的决策,会影响其他智能体未来的行动选择;同时,了解其他智能体未来的规划行动,也会影响当前智能体的行动决策。此外,多个智能体能够同时行动,这意味着在任何给定时刻,一个智能体的行动选择会影响其他智能体,也会受到其他智能体行动选择的影响。由于智能体可能采取的联合行动空间会随着智能体数量的增加呈指数级增长,在多智能体世界进行规划本质上是难以处理的,尤其是在动态、部分可观测和/或非确定性的环境中。不过,当智能体之间进行合作时,它们应努力做出决策,以在一段时间内尽可能有效地实现共同目标。
多智能体控制指的是多智能体系统中的智能体如何获取和利用信息,从而更好地决定当前的行动,使它们的联合行动能够推动共同目标的实现。多智能体规划不仅关注当前的决策,还关注一系列的决策,让智能体能够“向前看”,为其他智能体创造条件,以实现共同的期望目标。从合作的角度来看,如果一个智能体的局部成本投入能够使其他智能体获得更大的收益,那么它应该愿意承担这些成本。多智能体执行则扩展并在某种程度上结合了多智能体规划和控制,智能体既要主动规划它们的(交互)行动,以引导共享环境的发展,也要对突发或意外事件做出反应,控制自己的行为。
在单智能体规划中,解决难题的关键在于利用问题的结构,通常涉及局部性和组合性的概念。智能体的状态通常由各种特征组成(例如,关于智能体环境中哪些事实
超级会员免费看
订阅专栏 解锁全文
1640

被折叠的 条评论
为什么被折叠?



