连续分布与机器人定位:理论与实践解析
1. 连续分布中的信念定义
在处理连续分布时,我们需要考虑如何对噪声动作的结果及其可能性进行建模。之前我们成功扩展了后继状态公理,以用于对噪声动作进行建模。现在的关键问题是,如何考量噪声动作的结果及其可能性呢?
当推理关于智能体对公式 $\varphi$ 的信念时,我们需要对所有使 $\varphi$ 成立的潜在后继情况的密度进行积分。具体来说,对于在初始情况 $S_0$ 执行单个动作 $a$ 后对 $\varphi$ 的信念程度,有如下定义:
[Bel(\varphi, do(a, S_0)) = \frac{1}{\gamma} \int_{\vec{x}} \int_{z} P(\vec{x}, z, \varphi, do(a, S_0))]
其中
[P(\vec{x}, z, \varphi, do(a, S_0)) = \langle\iota, b. \bigwedge_{i} f_i(\iota) = x_i \land Alt(a, b, z) \land \varphi[do(b, \iota)] \to p(do(b, \iota), do(a, S_0)) \rangle]
这里,$i$ 遍历所有流的索引 ${1, \ldots, n}$。通过对 $\vec{x}$ 积分,我们考虑了所有可能的初始情况;通过对 $z$ 积分,我们考虑了所有可能的动作结果。
对于一系列动作的情况,有如下泛化定义:
定义 6.11(连续噪声执行器和传感器的信念程度) :假设 $\varphi$ 是任何省略情况的公式。在情况 $s$ 下对 $\varphi$ 的信
超级会员免费看
订阅专栏 解锁全文

941

被折叠的 条评论
为什么被折叠?



