15、回归与进展:概率信念下的行动推理

回归与进展:概率信念下的行动推理

在处理概率信念下的行动推理时,情况演算虽然是强大的表示语言,但如何有效推理仍是待解决的问题。这本质上是一个更复杂的投影问题,涉及知识状态、行动和感知的逻辑与概率断言混合。该问题可分为两部分:一是如何在特定状态下有效推理信念;二是如何有效推理信念状态的演化和变化。

1. 回归与进展的基本概念

在行动推理领域,对于定性(非概率)知识的投影问题,有两种主要解决方案:回归和进展。
- 回归 :将关于未来的查询简化为关于初始状态的查询。
- 进展 :根据每个行动的效果改变初始状态,然后检查公式在更新后的状态中是否成立。

在存在信念程度、有噪声的行动和感知的情况下,这两种方法可以进行推广,适用于离散和连续概率分布来指定信念和动态。

2. 回归结果的详细阐述

回归具有通用性,不需要(但允许)对领域设置结构约束,也不强制(但允许)对行动类型进行限制。它通过仅使用项和公式替换,推导出一个数学公式,将一系列行动和观察(即使有噪声)后的信念与初始状态的信念联系起来。

2.1 简单示例

假设有一个机器人面对一堵墙,与墙的距离为(h),机器人最初认为(h)服从([2, 12])上的均匀分布。当机器人移动(2)个单位后,想知道(h ≤ 5)的信念,回归会告知这等同于初始状态下(h ≤ 3)的信念,值为(0.1)。

2.2 非平凡示例

若机器人配备了一个指向墙的声纳单元,会添加均值为(\mu)、方差为(\sigma^2)的高斯噪声。当机器人移动(2)个

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值