动态环境中基于领域随机化的机器人导航规划
1. 引言
在现实世界中,自主机器人需要避免与行人碰撞,并对环境的突然变化做出快速反应。然而,大多数局部规划器依赖静态环境地图,无法捕捉环境中的不确定性。传统的机器人导航系统是模块化的,感知、状态估计、规划和控制等系统独立开发,整合和微调这些模块需要大量的领域经验和昂贵的人工劳动。此外,精确的环境地图并不总是可用,地图构建过程耗时且在某些应用中不可行,而且传统规划器无法利用经验来自我提升性能。
为了解决这些问题,提出了一种用于动态环境中点对点导航的端到端可训练规划器。通过强化学习训练一个策略,该策略根据传感器输入和相对目标位置生成机器人速度。这种方法不依赖丰富的环境地图,只需要高层的建筑平面图来指定目标位置。
2. 研究贡献
- 领域随机化实现鲁棒避障 :在避免与包括人类和移动纸箱等动态障碍物的碰撞方面,优于动态窗口法(DWA)和时间弹性带法(TEB),即使机器人被故意阻挡。
- 泛化到新环境 :在简单的有界空间中训练,但能泛化到办公室、走廊和工厂车间等环境。
- 全模拟训练 :学习过程安全(对人类和机器人平台无伤害)、成本低,且加速了10倍。
- 平台独立性 :在模拟环境中训练,可在具有不同运动学约束的移动平台上进行真实世界部署。
- 无需专家演示 :使用正向迁移学习将训练时间减少90%,避免了人类演示的次优性和收集的繁琐。
超级会员免费看
订阅专栏 解锁全文
2012

被折叠的 条评论
为什么被折叠?



