多机器人系统中拍卖与投标决策的概率学习方法
1. 引言
在过去几年里,移动机器人领域开始关注多机器人协作问题。相较于单个机器人,多机器人团队能更高效地完成任务,其应用范围广泛,涵盖行星探索、搜索救援和监视等领域。然而,多机器人协作也增加了问题的复杂性,需要有效的协调机制。多机器人任务分配(MRTA)问题便是其中的关键,即如何将一组任务合理分配给一组机器人,以最有效地实现团队目标。
解决MRTA问题可采用多种技术,包括运筹学、调度、组合优化和基于经济的方法。本文聚焦于基于经济或市场的方法,该方法将任务视为商品,机器人则作为自利的智能体参与拍卖。通过拍卖,任务在机器人之间分配,若机器人理性投标,任务分配将使团队整体利润最大化。此外,机器人在获得任务后,可将其拍卖给其他机器人,也能对其他机器人提供的任务进行投标,只要交易有利可图。
但这种方法存在两个关键问题:通信成本和计算成本。通信成本指运行拍卖所需的消息数量,由于机器人团队的网络资源通常有限,消息数量越少越好;计算成本则包括投标者计算每个任务投标的成本以及拍卖者清算拍卖的成本。为降低这些成本,我们提出一种方法,让机器人学习哪些任务值得纳入拍卖以及哪些任务值得投标。
2. 相关工作
基于市场的机制在多智能体社区广泛应用,近年来机器人领域也借鉴这些理念解决多机器人问题。不过,现有实现大多未充分考虑通信和计算成本,这可能对系统性能产生重大影响。
Gage和Murphy采用基于情感的方法解决此问题,他们在Parker的ALLIANCE架构基础上,为机器人添加羞耻情感,以控制机器人响应其他机器人求助的意愿。但该方法最终决策基于固定阈值,与我们的方法不同,我们的方法中任务特征直接驱
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



