感知不确定性下的规划与机器人定位
1 感知不确定性下的规划
1.1 问题表述与基础概念
在感知不确定性下进行规划时,对于确定性不确定空间(Indet)和概率性不确定空间(Iprob),我们可以将规划问题转化到新的状态空间 ⃗X 上进行考虑。例如,对于成本的计算,有以下公式:
- (\vec{l} F(\vec{x}_F) = \vec{l}_F(\eta_F) =\sum {x_F \in X} P(x_F|\eta_K)l_F(x_F)) (12.4)
在确定性不确定空间中,为每个阶段制定最坏情况成本过于悲观,因为不同阶段的高成本可能对应不同的路径,且没有约束使最坏情况分析针对同一路径。而在概率性情况下,由于可以为路径分配概率,所以不存在此问题。
当满足一定条件时,成本函数具有一些特殊性质。若在阶段 k 时,状态 (x_k) 位于 (X_k(\eta_k)) 内,且对于所有历史 I - 状态 (\eta_k = \vec{x}_k) 和 (u_k \in U),(l(x_k, u_k)) 在所有 (x_k \in X_k(\eta_k)) 上不变,则有:
- (\vec{l}(\vec{x}_k, \vec{u}_k) = \vec{l}(\eta_k, u_k) = l(x_k, u_k)) (12.5)
- (\vec{l}_F(\vec{x}_F) = \vec{l}_F(\eta_F) = l_F(x_F)) (12.6)
在没有观测的特殊情况下,I - 状态是可预测的,因为它仅由机器人选择的动作推导得出,此时新的规划问题可简化为特定的形式,且若给定初始 I - 状态,则不再需要反馈,
超级会员免费看
订阅专栏 解锁全文
2011

被折叠的 条评论
为什么被折叠?



