基于在线POMDP的稳健人员引导技术解析
1. 引言
在一些特定场景,如塞维利亚皇家阿尔卡萨尔和里斯本动物园,FROG项目旨在部署具有有趣个性且能考虑社会反馈的引导机器人。在这样动态的环境中,引导人员不仅要确保安全高效的导航,还需具备社交互动和社交意识。而机器人系统的稳健运行,如稳健导航,需要考虑系统中存在的各种潜在不确定性,部分可观察马尔可夫决策过程(POMDPs)为此提供了一个框架,能在规划机器人行动时考虑传感器和模型的不确定性。不过,将不确定条件下的规划广泛应用于机器人系统,还需解决维度灾难问题。
2. 相关工作
- POMDPs在机器人领域的应用 :近年来,POMDPs在机器人领域的应用日益广泛,这得益于过去十年中更高效的离线POMDP求解器的发展。但由于维度灾难,其在机器人领域的广泛应用受到限制。除了离线求解器,在线POMDPs也被考虑用于某些机器人应用,但同样面临相关问题。
- 人群环境中的导航 :在拥挤环境中实现高效稳健的导航,需要考虑人类行为模型、社会约束及其不确定性。常见的人类运动预测方法假设速度恒定,这在大多数情况下并不适用。人类的导航意图通常取决于环境的功能和结构,同时,机器人与人类的交互也需要被考虑,以实现高效导航。在人员引导应用中,有研究从数据中提取人类交互的概率模型,还有研究使用马尔可夫决策过程预测人员的目的地,但未考虑观察过程中的不确定性。与本文工作最接近的是,有研究使用POMDP推断轮椅导航中人员的意图,但采用的是离线POMDP模型,而本文的在线系统可以实时构建模型,并且能处理更大的状态空间和观察结果。
超级会员免费看
订阅专栏 解锁全文
691

被折叠的 条评论
为什么被折叠?



