文章主要内容总结
该论文针对无人机群的智能控制问题,提出了一种名为RALLY(Role-Adaptive LLM-Driven Yoked Navigation)的角色自适应大语言模型(LLM)驱动的协同导航算法。传统多智能体强化学习(MARL)方法存在数值通信中的语义鸿沟和角色结构僵化问题,而基于LLM的方法则缺乏在线学习能力,过度依赖静态先验知识,导致探索效率低。
RALLY算法通过三个核心模块解决这些问题:
- LLM驱动的语义决策框架:采用两阶段结构化自然语言推理(局部意图生成→邻域共识优化),实现高效语义通信与协同推理;
- 动态角色异质性机制:支持无人机自适应角色切换(指挥官、协调者、执行者等)和个性化决策;
- 基于角色价值混合网络(RMIX)的分配策略:融合LLM的离线先验知识与MARL的在线策略,实现角色选择策略的半离线训练。
实验在多智能体粒子环境(MPE)和软件在环(SITL)平台验证了RALLY在任务覆盖范围、收敛速度和泛化能力上优于传统方法,凸显了其在多无人机协同导航中的潜力。