12、连续分布与机器人行动理论中的信念推理

连续分布与机器人行动理论中的信念推理

在机器人和人工智能领域,对随机变量的信念推理以及处理传感器和执行器的噪声是非常重要的。本文将探讨连续分布下的信念推理,通过一个二维机器人的例子展示相关理论,并介绍如何处理有噪声的行动。

1. 连续分布下的信念推理基础

1.1 误差模型与后验信念

在连续分布的情境中,传感器测量的误差模型有着重要意义。假设 $Err(u_1, u_2)$ 是一个仅包含两个数值自由变量的表达式,它体现了传感器测量 $f$ 的误差模型仅依赖于 $f$ 的真实值,而与其他因素无关。为了简化,假设观测动作 $obs(z)$ 总是可执行的,即 $Poss(obs(z), s) \equiv true$。

由此可以得到定理 6.7:假设 $D$ 是一个包含 $obs(z)$ 的似然和前提条件公理的基本动作理论,$\varphi$ 是仅提及 $f$ 的任何公式,$u \in {x_1, \ldots, x_n}$ 是 $f$ 取值的变量。那么有:
[D \models Bel(\varphi, do(obs(z), S_0)) = \frac{\sum_{\vec{x}}[P(\vec{x}, \varphi \land f = u, S_0) \times Err(z, u)]}{\sum_{\vec{x}}[P(\vec{x}, f = u, S_0) \times Err(z, u)]}]
这表明,给定观测值 $z$ 时,$\varphi$ 的后验信念是通过 $\varphi$ 成立的所有点的先验密度和误差似然得到的,并在所有点上进行归一化。

常见的后验公式如 $b \leq f \leq c$,可以根据推

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值