32、使用时态逻辑集成目标与定性偏好

使用时态逻辑集成目标与定性偏好

1. RASA 第二层:目标作为硬约束

1.1 目标在行动选择中的作用

在行动选择机制里,智能体的目标以时态公式呈现。虽然行动选择规则能让智能体依据自身信念和目标以反应式方式推导出行动,但这一层面尚未全面体现目标在理性智能体行动选择机制中的全部作用。

若智能体具备有限步数的前瞻能力,就能借助目标避免选择那些会阻碍部分目标实现的行动。在此,我们定义 RASA 的第二层,用以体现目标的这一作用。目标会对行动选择增添额外约束,排除那些智能体预见到无法满足其目标的行动。这些约束属于硬约束,意味着执行某一行动若预见到会违反目标,理性智能体将尽可能选择替代行动,若无可选替代行动则会停止行动。

1.2 不同类型目标的选择性

  • 成就目标 :形如 ♦φ 的成就目标本身不会为行动选择增添额外约束。由于智能体的前瞻范围有限,无法断定某一行动会阻碍此类目标的实现。所以,成就目标在行动选择架构的基于规则机制之外,并无“选择力”。其主要作用是引导选择过程,并在达成目标后,为避免资源浪费,移除该目标作为行动的理由。
  • 维护目标 :像 □φ 这样的维护目标则具有选择力。若在前瞻范围内的某个状态下 φ 不成立,智能体就能判定无法满足该目标。智能体可利用此类目标过滤基于规则的第一层所生成的某些行动选项。例如,智能体油箱需保持最低燃油水平这一维护目标,在执行 goto(A) 行动会使燃油水平低于最低值时(假设前往某地会消耗燃油),将阻止该行动的选择。

1.3 前瞻范围与目标评估

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值