30、基于在线POMDP的稳健人员引导技术解析

基于在线POMDP的稳健人员引导技术解析

1. 引言

在一些特定场景,如塞维利亚皇家阿尔卡萨尔和里斯本动物园,FROG项目旨在部署具有有趣个性且能考虑社会反馈的引导机器人。在这样动态的环境中,引导人员不仅要确保安全高效的导航,还需具备社交互动和社交意识。而机器人系统的稳健运行,如稳健导航,需要考虑系统中存在的各种潜在不确定性,部分可观察马尔可夫决策过程(POMDPs)为此提供了一个框架,能在规划机器人行动时考虑传感器和模型的不确定性。不过,将不确定条件下的规划广泛应用于机器人系统,还需解决维度灾难问题。

2. 相关工作
  • POMDPs在机器人领域的应用 :近年来,POMDPs在机器人领域的应用日益广泛,这得益于过去十年中更高效的离线POMDP求解器的发展。但由于维度灾难,其在机器人领域的广泛应用受到限制。除了离线求解器,在线POMDPs也被考虑用于某些机器人应用,但同样面临相关问题。
  • 人群环境中的导航 :在拥挤环境中实现高效稳健的导航,需要考虑人类行为模型、社会约束及其不确定性。常见的人类运动预测方法假设速度恒定,这在大多数情况下并不适用。人类的导航意图通常取决于环境的功能和结构,同时,机器人与人类的交互也需要被考虑,以实现高效导航。在人员引导应用中,有研究从数据中提取人类交互的概率模型,还有研究使用马尔可夫决策过程预测人员的目的地,但未考虑观察过程中的不确定性。与本文工作最接近的是,有研究使用POMDP推断轮椅导航中人员的意图,但采用的是离线POMDP模型,而本文的在线系统可以实时构建模型,并且能处理更大的状态空间和观察结果。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值