机器人拍卖与投标决策的概率学习方法
1 引言
近年来,移动机器人领域开始关注多机器人协作问题。多机器人团队能比单个机器人更高效地完成任务,其应用广泛,涵盖行星探索、搜索救援和监视等领域。然而,多机器人协作增加了问题的复杂性,需要有效的协调机制。多机器人任务分配(MRTA)成为研究热点,其核心问题是如何将一组任务合理分配给一组机器人,以实现团队目标的最优达成。
解决 MRTA 问题的方法多样,包括运筹学、调度、组合优化和基于经济的方法。本文聚焦于基于经济或市场的方法,该方法将任务视为商品,机器人作为自利的代理在拍卖中对商品进行投标。通过拍卖,任务在机器人之间分配,若机器人理性投标,任务分配将使团队整体利润最大化。而且,机器人在获得任务后,可将其拍卖给其他机器人,也能对其他机器人提供的任务进行投标。
但这种方法存在两个关键问题:通信成本和计算成本。通信成本指运行拍卖所需的消息数量,由于机器人团队的网络资源有限,消息数量越少越好;计算成本包括投标者计算每个任务投标的成本和拍卖者清算拍卖的成本。为降低这些成本,本文提出一种方法,让机器人学习哪些任务值得纳入拍卖,哪些任务值得投标。
2 相关工作
基于市场的机制在多智能体社区广泛应用,近年来机器人领域也借鉴这些思想解决多机器人问题。不过,现有实现大多未充分考虑通信和计算成本,这可能对系统性能产生重大影响。
有研究采用基于情感的方法,通过给机器人添加羞耻情感来控制其响应其他机器人求助的意愿,但最终决策基于固定阈值,与本文根据任务特征直接决定是否投标的方法不同。此外,与学习投标策略以最大化代理在经济系统中利润的方法不同,本文专注于学习给定投标赢得拍卖的概率,以及学习机器人提供的任务
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



