人机交互中活动与意图理解的探索
1. 引言
随着机器人从工厂走进人们的日常生活,它们所需的技能与 20 世纪编程赋予的技能有了很大不同,很多技能聚焦于与人类的交互。人机交互领域中,意图识别是一个有趣的问题,即通过观察预测人的意图,可看作机器人“读心术”。人类日常能轻松“读心”并推断他人意图,若要让机器人在社交场景与人类成功互动,就需赋予其理解人类意图的能力。
2. 相关工作
在随时间演变的系统中进行统计分类时,隐马尔可夫模型(HMM)或许适用,它在语音识别中应用成功。近期有迹象表明 HMM 在建模活动和意图方面也有用,不过以往使用 HMM 的方法存在问题,仅能在活动完成后检测目标是否达成,不利于意图识别的预测。2007 年首次提出在意图识别中使用 HMM 并强调预测元素,但该系统有不足待改进。此外,神经科学研究表明镜像神经元系统和上下文信息在意图识别中起作用。
3. 重新审视意图识别问题
一些研究者认为活动识别和意图识别本质相同,但更普遍的观点是意图识别有预测成分,即判断一个人近期可能的行动。然而,意图识别还需具备消歧能力,因为有些行动除意图外其他方面可能相同。例如,下棋时伸手拿棋子,在不同阶段(赛前、赛中、赛后)意图不同,但动作可能相似,此时消歧对理解行动至关重要。
4. 基于视觉的能力
为机器人系统提供基于视觉的感知能力,以促进对其他主体行动的建模和识别。由于主体外观通常未知,主要通过图像运动检测和跟踪。采用实时监控中基于背景建模和分割的高效可靠技术:
- 活动建模阶段 :机器人移动执行各种活动,通过静态观察构建其他移动主体的外观模型,使
超级会员免费看
订阅专栏 解锁全文
1184

被折叠的 条评论
为什么被折叠?



