可解释行为生成中的环境设计
1. 可解释行为与环境设计概述
在共享环境中,环境设计对提升机器人行为的可解释性至关重要。例如在厨房场景中,人类期望机器人遵循特定的路径(如图 3.3 中绿色高亮部分)。然而,是进行环境修改还是承受不可解释行为带来的影响,取决于改变环境的成本与行为不可解释性所造成的成本。
2. 问题设定
考虑可解释性问题 PExp = ,当人类心理模型已知时,设人类模型中预期的计划集 …MRh 为 MRh 中的最优计划集。机器人的目标是最小化在人类心理模型中的不可解释性得分。用 …IE(·, MRh, ıMRh)(在无参数 R 的情况下)表示机器人模型中不可解释性得分最低的计划集,IEmin(PExp) 表示与该集合相关的最低不可解释性得分。可解释机器人使用的决策函数 fExp(PExp) 表示使不可解释性得分最小化的最便宜计划,即 fExp(PExp) ∈ …IE(·, MRh, ıMRh) 且不存在 0 ∈ …IE(·, MRh, ıMRh) 使得 cR(0) < cR(fExp(PExp))。
3. 环境设计问题
环境设计问题以初始环境配置和一组可用修改为输入,计算可应用于初始环境的修改子集,以得到一个优化了期望目标的新环境。初始环境记为 MR0 = ,其有效配置集为 R(MR0 ∈ R)。设 O 为需要通过环境设计优化的指标,设计问题是一个元组 ,其中:
- 是所有修改的集合。
- ƒR: R × 2 → R 是模型转换函数,指定将修改子集应用于现有模型后的结果模型。
- C: → R 是成本函数,将每个设计选择映射到其成本,且修改相互独立,成本可加。
超级会员免费看
订阅专栏 解锁全文
2064

被折叠的 条评论
为什么被折叠?



