34、随机动作与观察的逻辑规范

随机动作与观察的逻辑规范

在处理涉及随机动作和观察的场景时,需要一种有效的逻辑来进行规范和推理。下面将详细介绍相关内容。

1. 相关工作对比

在静态领域中,已经存在多个用于概率推理的框架。但这些框架与我们关注的逻辑有所不同,具体对比如下:
|框架名称|特点|与SLAOP对比|
| ---- | ---- | ---- |
|静态领域概率推理框架|关注知识随新信息的变化,但不将信息视为观察对象,且认为新信息是确定的|SLAOP更关注随机动作对系统物理状态的改变,能表达观察信息可能存在一定程度的错误|
|Poole的ICLSC|是一个相对丰富的框架,包含变量、量化和函数符号的无环逻辑程序|SLAOP更简单,语义接近标准POMDP理论,且推理的可判定性有保障|
|Bonet和Geffner的框架|使用启发式搜索算法建模和解决MDPs和POMDPs,采用高级逻辑表示,但不是逻辑,也不使用逻辑蕴涵|SLAOP是一种逻辑,可进行逻辑推理|
|DTGolog|是一种编程语言,不处理随机观察|SLAOP专注于随机动作和观察的逻辑规范|
|PODTGolog|处理随机观察,但语义不明确|SLAOP有明确的语义|
|基于情况演算的框架|表达能力强,但对于我们的需求过于复杂,且推理的可判定性难以保证|SLAOP限制在命题模态框架,可判定性是其优势|
|Iocchi等人的E+逻辑|处理具有感知、定性非确定性和概率不确定性的动作结果规划,但不处理噪声感知,也不能表示动作奖励和成本|SLAOP能处理噪声感知,并可独立指定动作成本和奖励|

2. SLAOP的语法

SLAOP语言的词汇包含以下六种对

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值