9、机器人行为解释:模型调和视角

机器人行为解释:模型调和视角

1. 可预测性与规划可读性

在机器人的行为研究中,可预测性和规划可读性是两个重要的概念。可预测行为具有明确的目标,并且在全局或局部上都易于被观察者预期。全局可预测行为是指观察者能预期机器人为了某个目标而执行的行为;局部可预测行为则是指在给定一个计划前缀的情况下,观察者能够轻松预期朝向某个目标的计划后缀。

然而,规划可读性并不总是能导致可预测行为。规划可读性强调的是在给定相应观察序列的情况下,让机器人的动作易于猜测,但观察序列本身对观察者来说可能在全局甚至局部都不可预测。

2. 模型调和作为解释

2.1 解释的必要性

当机器人选择基于自身模型的行为时,如果人类对机器人模型的估计与实际模型不同,人类可能会觉得机器人的行为难以理解。为了解决这个问题,可以通过解释机器人模型与人类估计之间的差异来提高行为的可解释性,这个过程被称为模型调和。

2.2 模型调和的定义

模型调和问题(MRP)可以表示为一个元组 $\langle\pi^ , \langle M_R, M_R^h \rangle\rangle$,其中 $\pi^ $ 是机器人模型 $M_R$ 中的最优计划,但在人类心理模型 $M_R^h$ 中可能并非如此。

一个解释可以定义为模型调和问题的解决方案,具体包括:
1. 一个模型更新 $E$;
2. 机器人的最优计划;
3. 该计划在更新后的心理模型中也是最优的。

2.3 模型空间搜索问题

为了找到解释,可以将其转化为在可能的模型更新空间中进行搜索的问

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值