基于多臂老虎机算法的固定基座机器人任务调度策略
1. 机器人路径规划成本计算
在机器人的路径规划中,成本的计算至关重要。成本主要由两部分组成:
- 目标距离成本:即从目标点到轨迹终点的距离。增加这部分的权重会使机器人选择更高的速度向目标移动。
- 障碍物成本:沿着模拟的前向轨迹的障碍物成本。在计算障碍物成本时,地图上有障碍物的点的成本被设为很高。如果机器人在任何模拟的前向轨迹上发生碰撞,成本将非常高,动态窗口法(DWA)规划器将不会选择该速度和角速度对。
成本计算公式如下:
cost = path_distance_bias * (distance to path from the endpoint of the trajectory) +
goal_distance_bias * (distance to goal from the endpoint of the trajectory) +
occdist_scale * (maximum obstacle cost along the trajectory in obstacle cost)
这个成本取决于与障碍物的距离、与目标点的接近程度以及速度。选择成本最小的轨迹,并周期性地重复这个过程,直到到达目标点。
2. 多臂老虎机任务调度方法
2.1 多臂老虎机问题建模
多臂老虎机(MAB)问题是一个经典的强化学习问题,需要在竞争的选择中分配一组固定的资源。在当前问题中,多个接近给定货架的移动机器人是竞争选
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



