基于BDI的智能体心理状态溯因推理
1. 计划与行为规则
1.1 计划的表示
设 $L$ 是一个命题语言,其典型元素为 $\varphi$,包含否定符号 $\neg$ 和标准合取连接符 $\wedge$。信念公式 $\beta$ 和目标公式 $\kappa$ 是 $L$ 中的元素。同时,假设存在一个基本动作集合 $A$,其典型元素为 $\alpha$。智能体的计划由基本动作 $\alpha$、对命题公式的测试以及非确定性选择运算符组成。
计划表达式 $L_{\Pi}$ 的典型元素 $\pi$ 定义如下:
$\pi ::= \alpha | \varphi? | \pi_1 + \pi_2 | \pi_1; \pi_2$
在这个工作中,主要关注这些计划的语法形式,而不定义智能体操作的语义。不过,对智能体执行计划的方式做了一些假设:
- 只有外部动作是可观察的,由于所有基本动作 $\alpha \in A$ 都被定义为外部动作,所以它们是可观察的。
- 对命题公式的内部测试动作 $\varphi?$ 是不可观察的。
- 选择运算符 $+$ 是一个非确定性选择运算符,作用于两个计划元素 $\pi \in L_{\Pi}$,也可用于表示形如 “if $\varphi$ then $\pi_1$ else $\pi_2$” 的确定性指令,即 $(\varphi?; \pi_1) + (\neg\varphi?; \pi_2)$。
- 引入空动作 $\epsilon$,使得 $(\pi; \epsilon) \equiv (\epsilon; \pi) \equiv \pi$。
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



