传感器与信息空间:离散状态空间的信息处理与规划
在决策理论规划中,信息空间的处理至关重要。不同的信息空间模型,如非确定性信息空间、概率信息空间和有限记忆信息空间,为解决各种规划问题提供了有效的方法。下面将详细介绍这些信息空间的概念、计算方法,并通过具体示例进行说明。
非确定性信息空间
非确定性信息空间将历史信息状态转换为对应所有可能当前状态的子集。在这个模型中,自然的行为是不确定的,我们只知道其行动是从特定集合中选择。
- 相关函数定义
- 从状态转移函数 $f$ 定义集合值函数 $F$:$F(x, u) = {x′ ∈X | ∃θ ∈\varTheta(x, u) \text{ 使得 } x′ = f (x, u, θ)}$。
- 对于每个观测 $y_k$,可以推断出可能的状态集合 $H(y_k) ⊆X$。
- 非确定性信息状态的计算
- 基础情况($k = 1$) :$X_1(η_1) = X_1(η_0, y_1) = X_1 ∩H(y_1)$。
- 归纳步骤 :
- 计算 $X_{k + 1}(η_k, u_k) = \bigcup_{x_k∈X_k(η_k)} F(x_k, u_k)$。
- 考虑观测 $y_{k + 1}$ 后,$X_{k + 1}(η_{k + 1}) = X_{k + 1}(η
超级会员免费看
订阅专栏 解锁全文
3594

被折叠的 条评论
为什么被折叠?



