回归与进展:概率信念下的行动推理
在处理概率信念下的行动推理时,情况演算虽然是强大的表示语言,但如何有效推理仍是待解决的问题。这本质上是一个更复杂的投影问题,涉及知识状态、行动和感知的逻辑与概率断言混合。该问题可分为两部分:一是如何在特定状态下有效推理信念;二是如何有效推理信念状态的演化和变化。
1. 回归与进展的基本概念
在行动推理领域,对于定性(非概率)知识的投影问题,有两种主要解决方案:回归和进展。
- 回归 :将关于未来的查询简化为关于初始状态的查询。
- 进展 :根据每个行动的效果改变初始状态,然后检查公式在更新后的状态中是否成立。
在存在信念程度、有噪声的行动和感知的情况下,这两种方法可以进行推广,适用于离散和连续概率分布来指定信念和动态。
2. 回归结果的详细阐述
回归具有通用性,不需要(但允许)对领域设置结构约束,也不强制(但允许)对行动类型进行限制。它通过仅使用项和公式替换,推导出一个数学公式,将一系列行动和观察(即使有噪声)后的信念与初始状态的信念联系起来。
2.1 简单示例
假设有一个机器人面对一堵墙,与墙的距离为(h),机器人最初认为(h)服从([2, 12])上的均匀分布。当机器人移动(2)个单位后,想知道(h ≤ 5)的信念,回归会告知这等同于初始状态下(h ≤ 3)的信念,值为(0.1)。
2.2 非平凡示例
若机器人配备了一个指向墙的声纳单元,会添加均值为(\mu)、方差为(\sigma^2)的高斯噪声。当机器人移动(2)个
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



