多智能体路径规划与双足机器人敏捷跑步控制技术解析
在多智能体系统和机器人控制领域,多智能体路径规划(MAPF)以及双足机器人的敏捷跑步控制是两个重要的研究方向。本文将深入探讨这两个领域的相关技术,包括死锁检测、通信学习、3D - SLIP 模型调控等关键内容。
多智能体路径规划中的死锁检测与通信学习
在多智能体路径规划问题中,死锁是一个常见且棘手的问题。死锁可分为两种情况:
- 停滞状态死锁 :多个智能体在通道上相互锁定并停滞不前。
- 徘徊状态死锁 :两个智能体同时做出相互避让的决策,类似于徘徊的情况。
为了有效地检测死锁,引入了拥挤度的概念。拥挤度的计算方式为每个智能体视野半径为 2 的范围内的智能体数量。具体的死锁检测步骤如下:
1. 预标记 :如果检测到智能体处于停滞或徘徊状态,并且拥挤度大于或等于 1 持续多步保持不变或增加,则将该智能体预标记为死锁。
2. 确认检查 :预标记的死锁状态并不一定意味着智能体处于真正的死锁状态,因为死锁状态必须由多个智能体抢占通道资源引起。因此,在预标记过程之后,会进行另一轮检查。如果在附近出现两个或更多预标记的死锁智能体,则确认这些智能体处于死锁状态;如果预标记的智能体没有被其他预标记的智能体包围,则确定该智能体处于非死锁状态。
3. 信息添加与惩罚 :将死锁状态信息添加到启发式辅助通道中,并对死锁状态施加相关惩罚,以鼓励智能体学会跳出死锁状态。
在实验方面,设置了训练和测试环境:
多智能体路径规划与机器人控制
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



