15、查询特定模型获取与解释相关技术解析

查询特定模型获取与解释相关技术解析

1. 引言

在模型规划与决策中,常常会遇到替代计划(foil)不可执行或成本过高的情况。本文将围绕如何解释替代计划的无效性和次优性,以及相关模型部分的识别、解释置信度计算、概念映射不确定性处理和新词汇获取等方面展开讨论。

2. 替代计划的问题分析

替代计划 f 可能存在两种问题:
- 不可执行:这意味着要么动作序列无法导向可能的目标状态(T .I; f / 62 G),要么计划执行会导致无效状态(T .I; f / = ?)。
- 成本更高:即 C.I; / < C.I; f /。

以蒙特祖玛的例子来说,假设计划是让智能体从最高平台出发,目标是拿到钥匙。指定计划 可能要求智能体先到达最低层,跳过骷髅,然后去拿钥匙,总成本为 20。用户提出两个与 相似的替代计划:
- 第一个替代计划中,智能体不跳而是向左移动(试图穿过骷髅)。
- 第二个替代计划中,智能体不跳过骷髅,而是执行攻击动作(为说明而添加),然后去拿钥匙。

使用模拟器可以判断,第一个替代计划向左移动会导致无效状态,第二个替代计划成本更高。但系统难以直接向用户解释导致无效性或次优性的具体状态或状态序列方面的原因,需要将其映射到特定的符号模型并暴露相关信息。

3. 解释生成
3.1 解释替代计划的无效性

要确定 f 的无效性,只需关注第一个失败动作 ai 的失败原因,即导致无效状态的最短前缀中的最后一个动作。可以通过告知用户,根据符号模型,失败动作在执行状态中存在未满足的前置条件来解释。

定义 8.2:对于替代计划

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值