随机动作与观察的逻辑规范
在处理涉及随机动作和观察的场景时,需要一种有效的逻辑来进行规范和推理。下面将详细介绍相关内容。
1. 相关工作对比
在静态领域中,已经存在多个用于概率推理的框架。但这些框架与我们关注的逻辑有所不同,具体对比如下:
|框架名称|特点|与SLAOP对比|
| ---- | ---- | ---- |
|静态领域概率推理框架|关注知识随新信息的变化,但不将信息视为观察对象,且认为新信息是确定的|SLAOP更关注随机动作对系统物理状态的改变,能表达观察信息可能存在一定程度的错误|
|Poole的ICLSC|是一个相对丰富的框架,包含变量、量化和函数符号的无环逻辑程序|SLAOP更简单,语义接近标准POMDP理论,且推理的可判定性有保障|
|Bonet和Geffner的框架|使用启发式搜索算法建模和解决MDPs和POMDPs,采用高级逻辑表示,但不是逻辑,也不使用逻辑蕴涵|SLAOP是一种逻辑,可进行逻辑推理|
|DTGolog|是一种编程语言,不处理随机观察|SLAOP专注于随机动作和观察的逻辑规范|
|PODTGolog|处理随机观察,但语义不明确|SLAOP有明确的语义|
|基于情况演算的框架|表达能力强,但对于我们的需求过于复杂,且推理的可判定性难以保证|SLAOP限制在命题模态框架,可判定性是其优势|
|Iocchi等人的E+逻辑|处理具有感知、定性非确定性和概率不确定性的动作结果规划,但不处理噪声感知,也不能表示动作奖励和成本|SLAOP能处理噪声感知,并可独立指定动作成本和奖励|
2. SLAOP的语法
SLAOP语言的词汇包含以下六种对
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



