76、决策理论规划与环境不确定性问题解析

决策理论规划与环境不确定性问题解析

1. 决策理论规划中的概率测量模型

在机器人的决策理论规划中,密度函数 (p(y_k|x_k)) 表示在给定状态 (x_k) 时各种测量值的相对可能性。通常,它用于建模通过激光测距扫描仪、声纳阵列甚至红外传感器获得的距离测量值。

假设一个机器人在二维环境中移动,并在不同方向上进行深度测量。在机器人本体坐标系中,会在 (n) 个角度进行深度测量。理想情况下,测量值应如图 11.15b 所示,但实际上数据包含大量噪声。观测值 (y \in Y) 是一个 (n) 维的噪声深度测量向量。

定义 (p(y|x)) 的一种常见方法是假设每个距离测量的误差遵循高斯密度。一旦给定状态 (x),测量的均值可以很容易地计算为真实距离值,而方差则需通过传感器的实验评估来确定。如果假设测量向量被建模为一组独立同分布的随机变量,那么 (p(y|x)) 就是高斯密度的简单乘积。

当模型建立后,概率信息状态(probabilistic I - states)的计算可直接依据相关规则进行。初始条件是状态空间 (X) 上的概率密度函数 (p(x_1)),然后应用边缘化和贝叶斯更新规则,为每个阶段 (k) 构建形式为 (p(x_k|\eta_k)) 的密度函数序列。

在某些有限的应用中,用于表示 (p(x_{k + 1}|x_k, u_k)) 和 (p(y_k|x_k)) 的模型可能是线性和高斯的,此时可以轻松应用卡尔曼滤波器。然而,在大多数情况下,密度函数不具有这种形式,可使用基于矩的近似方法来近似这些密度。若使用二阶矩,则可得到扩展卡尔曼滤波器,它将卡尔曼滤波器的更新规则应用于原问题的线性 - 高斯近似。近年来,在实验性移动机器人领域,

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值