传感器与信息空间解析
在决策理论规划中,信息空间的处理至关重要。不同类型的信息空间,如非确定性信息空间、概率信息空间和有限记忆信息空间,为解决各种规划问题提供了不同的视角和方法。下面将详细介绍这些信息空间的定义、计算方法以及相关示例。
1. 非确定性信息空间
非确定性信息空间通过 I - 映射 $\kappa_{ndet}$ 将历史 I - 状态转换为对应所有可能当前状态的 $X$ 的子集。在这个模型中,自然动作是非确定性的,没有关于自然将选择何种动作的信息,仅知道其选择范围在 $\Theta$ 和 $\Psi$ 内。
1.1 相关函数定义
- 函数 $F$ :从状态转移函数 $f$ 定义而来,$F(x, u) = {x’ \in X | \exists\theta \in \Theta(x, u) \text{ 使得 } x’ = f(x, u, \theta)}$。它是一个集值函数,消除了自然动作的直接出现,在计算非确定性 I - 状态时非常方便。
- 函数 $H$ :对于每个观测 $y_k$,可以推断出可能的 $x_k$ 值的集合 $H(y_k) \subseteq X$。
1.2 非确定性 I - 状态的计算
采用归纳法计算非确定性 I - 状态 $X_k(\eta_k)$:
- 基础情况($k = 1$) :$X_1(\eta_1) = X_1(\eta_0, y_1) = X_1 \cap H(y_1)$。这一步通过集合交集将初始条件和
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



