- 多智能体强化学习问题定义
- 主流多智能体算法
- 人机协作指挥决策的关键技术
多智能体间的协同/对抗学习方法,还包括如何将“人在环”(Human-in-the-Loop)纳入系统,以实现人机协作式决策。

3.1 多智能体强化学习问题定义
3.1.1 多智能体协同与对抗场景
在单智能体强化学习中,环境通常由一个智能体与外部世界构成。而在多智能体环境中,存在多个智能体 (agents),它们相互影响、同时进行学习和决策,因此会出现博弈和协同等复杂行为。
-
多智能体协同 (Cooperative)
- 多个智能体有共同目标或部分重叠的目标,需要协同分工、共同完成任务;
- 例如:多机器人协同搬运、多无人机协同搜索