机器人行为解释:模型调和视角
1. 可预测性与规划可读性
在机器人的行为研究中,可预测性和规划可读性是两个重要的概念。可预测行为具有明确的目标,并且在全局或局部上都易于被观察者预期。全局可预测行为是指观察者能预期机器人为了某个目标而执行的行为;局部可预测行为则是指在给定一个计划前缀的情况下,观察者能够轻松预期朝向某个目标的计划后缀。
然而,规划可读性并不总是能导致可预测行为。规划可读性强调的是在给定相应观察序列的情况下,让机器人的动作易于猜测,但观察序列本身对观察者来说可能在全局甚至局部都不可预测。
2. 模型调和作为解释
2.1 解释的必要性
当机器人选择基于自身模型的行为时,如果人类对机器人模型的估计与实际模型不同,人类可能会觉得机器人的行为难以理解。为了解决这个问题,可以通过解释机器人模型与人类估计之间的差异来提高行为的可解释性,这个过程被称为模型调和。
2.2 模型调和的定义
模型调和问题(MRP)可以表示为一个元组 $\langle\pi^ , \langle M_R, M_R^h \rangle\rangle$,其中 $\pi^ $ 是机器人模型 $M_R$ 中的最优计划,但在人类心理模型 $M_R^h$ 中可能并非如此。
一个解释可以定义为模型调和问题的解决方案,具体包括:
1. 一个模型更新 $E$;
2. 机器人的最优计划;
3. 该计划在更新后的心理模型中也是最优的。
2.3 模型空间搜索问题
为了找到解释,可以将其转化为在可能的模型更新空间中进行搜索的问
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



