基于多臂老虎机的仓库固定基座机器人任务调度方法
1. 引言
在不久的将来,异构多机器人系统将在工业和日常生活中得到广泛应用。多机器人系统(MRS)被用于仓库和工业环境中处理物流任务。在多机器人系统中,任务分配是根据任务性质将任务分配给单个或一组代理,而任务调度则是根据目标和约束安排任务或子任务的执行顺序。
多智能体取货和配送问题涉及任务分配、任务调度、多智能体路径规划和控制。任务分配和调度技术的目标是优化执行时间、行驶距离等成本或目标。过去几十年,人们使用了集中式、混合式和分布式等多种方法来解决任务分配问题,其中分布式拍卖方法被证明更高效。
多智能体任务调度在不同能力的机器人需要协作时变得具有挑战性,因为任务或子任务的调度会影响每个代理的任务完成时间。本文研究了仓库场景下的任务调度策略,其中固定基座机器人和移动机器人需要协作完成将包裹从取货点移动到货架的任务。当多个移动机器人到达固定基座机器人处时,需要生成子任务调度表,这会影响移动机器人的子任务完成时间,因为它们可能需要等待调度器选择。
本文提出了基于多臂老虎机(MAB)的任务调度方法。多臂老虎机是经典的强化学习问题,代理需要在多个臂中选择以获得最佳奖励,通过随机探索和利用学习每个臂的奖励概率。本文提出的基于MAB的随机调度器会优先处理概率估计较高的移动机器人任务,并确保固定基座机器人和移动机器人在时间和空间上的协调。
2. 相关工作
- 任务分配与调度研究
- 多机器人任务分配(MRTA)在文献中得到了广泛研究,但分配的任务还需要各个代理进行调度执行。
- 一些研究
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



