先有表现力,后有动作:具身交互作为机器人行为的内在表现力驱动
在当今科技发展的浪潮中,社交机器人的研究与开发正日益受到关注。社交机器人旨在与人类在社交场景中进行自然交互,这就要求它们不仅要依靠言语交流,还需考虑动作的表现力、意图以及语音语调等因素。本文将深入探讨机器人行为中表现力与动作的关系,以及如何通过具身交互来提升机器人的社交能力。
1. 表现力与动作的关系
表现力与动作的关系密切,这涉及到符号接地问题。传统观点认为,自适应主体的行为是由信息处理机制驱动的,管理抽象符号的能力源于认知机制的本质。然而,这种观点受到了具身认知范式的挑战。具身认知范式认为,身体的特性塑造了我们概念化和分类的可能性,身体配置决定了主体与世界之间的信息流。
例如,在具身机器人的研究中,多次证明了身体配置对信息流动的决定性作用。不同的身体配置使得主体从世界中提取相关信息的方式不同,世界不需要被完全表征,主体可以根据自身的具身形式直接从世界中获取信息。
此外,镜像神经元的发现也为理解动作和表现力提供了新的视角。镜像神经元在动作执行或观察他人执行动作时都会被激活,人类的镜像系统在观察或执行特定动作时也会有显著的激活。这表明具身行为本身就是关于意图和内部状态的信息来源,即使动作并非主体有意表达。
这种基本的动作理解机制可能是语言等高级认知功能的基础。有研究表明,镜像神经元可能是语言对等性的核心,听者可以通过具有手势镜像机制的系统理解说话者的意思。同时,神经科学的研究也显示,负责动作识别的一些神经结构是沟通的基础,语言能力可能从理解他人动作的能力进化而来。
在机器人领域,也有相关的研究支持动作理解与语言的关系。Jun Tani的研究表明,多层次递归神经网络可以实现对感官流的预测和抽象组合信息的提取,机器人通过训练可以学习组合语义规则。Olier等人的研究则表明,机器人可以通过耦合感知和动作来创建概念,强调了大多数机器人方法中仅基于观察进行推理的不足。
这些研究都表明,动作表现力不仅对于交互主体之间的信息交换很重要,对于社会和认知技能的进化和发展,如分类和语言,也具有重要意义。
2. 情感与表现力
情感与表现力的研究密切相关。当研究者思考如何让机器人更具表现力以实现与人类的自然交互时,首先想到的是让机器人具备识别和表达情感的能力。然而,我们所采用的情感概念对如何处理动作表现力问题有着重要的影响。
传统观点认为,表现力最好通过关注专门用于传达情感的行为来研究,这一观点源于情感理论的历史。达尔文最早对人类和动物的情感表达进行了理论化,他认为某些复杂动作在特定心理状态下有直接或间接的作用,当相同的心理状态被激发时,即使很微弱,也会因习惯和联想的力量而倾向于执行相同的动作。
基本情绪理论认为,一些神经生理途径进化出了适应性反应或行动程序,基本情绪反应的所有组成部分在情绪发生时会一起被触发。生理成分起到适应作用,而表达成分主要起到沟通作用。然而,对于基本情绪的具体集合并没有达成一致,不同的研究者提出了不同的观点,如Ekman提出的愤怒、厌恶、恐惧、快乐、悲伤和惊讶,Plutchik提出的八组情感。
在社交机器人的研究中,许多采用了基本情绪方法。定义一组情绪,让机器人具备模式识别系统来匹配表情与情绪集合中的项目,或者具备模仿面部表情的能力。这种方法的优点是便于建模,但需要准结构化的交互。
然而,基本情绪远未得到普遍接受,许多研究主张将情绪视为复杂的自适应现象。动态系统方法认为,情绪是众多神经生理和认知成分与现实世界动态交互的结果,情绪是动态行为的全局属性。
评价理论认为,情绪必然涉及对主体与环境关系的评价,这种评价不仅是认知事件,还涉及关系和动机方面。表达行为是与主体之间关系相关的活动,其主要功能是建立、维持或破坏与环境的某种关系,情绪事件是行动准备状态的显著变化。
在交互过程中,情感表达不是从第三人称视角感知的,而是与交互的动态相关,对于表达主体和接收主体都很重要。因此,真正的挑战是建模能够参与交互的主体,使这些表达在配置交互主体之间的动态关系中发挥作用。
3. 舞蹈与动作表现力理解
舞蹈可以为社交机器人理解动作表现力提供有价值的经验。舞蹈本身专注于动作的产生和组合意义,以及观众观看他人动作时的体验。舞蹈理论不断在教学和表演中得到测试和完善。
例如,舞蹈中的一个关键问题是节奏,即如何将富有表现力的动作结构化为动作基元,以便更好地理解动作的组合意义。在机器人编程中,动作基元的问题也至关重要,评估舞蹈符号将复杂机器人动作分解为基本动作序列的潜力是有价值的。
舞蹈与语言的关系可以追溯到古代,Plutarch称舞蹈为“无声的诗歌”,诗歌为“会说话的舞蹈”。舞蹈科学的研究者认为,舞蹈和语言依赖于相同的认知基础设施,Collinwood甚至认为舞蹈是所有语言的母体。
Orgs等人区分了姿势、动作和动作序列的句法信息处理与动作意图的语义处理。表演者和观众之间成功的信息传递提供了关于他们思考、感受、感知或直觉的线索。“参与”的概念认为,舞蹈的成功可以基于其能否清晰地体现编舞者的意图以及是否发展出清晰的编舞结构或句法,而不仅仅取决于观众的审美或流派偏好。
因此,为了理解开放式动作中的表现力,机器人可以利用舞蹈所积累的丰富经验知识。特别是那些有助于理解动作如何被感知、意义如何在动作中组合以及动作模式如何形式化的方法。
4. Laban系统在机器人中的应用
Laban的动作分析理论在机器人领域有应用。Rudolf Von Laban是一位编舞家,他创造了一种描述、可视化、解释和记录人类动作的方法,其方法被称为书面舞蹈,Laban符号系统被称为Laban Kinetography和Labanotation。Bartenieff和Lewis将这种符号方法提升为一种用于动作定性分析的工具,即Laban Movement Analysis (LMA)。
LMA强调运动动作背后的具身过程,而不是最终的运动动作或轨迹。它通过引入四个运动成分“身体、努力、形状和空间 (BESS)”来捕捉动作的意图和情感表现力,定性分析结果取决于这些成分在运动基元发展过程中的整合程度。
其中,努力成分对机器人特别有意义,Laban有时称之为运动的动力学,它指向动作执行方式的微妙特征,与动作的意图和情感负载有关。对运动的强度、控制和时间的关注尤为重要。努力的时间子类别通过运动短语中的减速或加速来表达,范围在持续时间和快速时间两个对立面之间。通过对流动的分析可以进一步解释动作,流动可以在自由流动和受限流动之间变化,它负责运动的连续性,与运动的展开动力学相关。
这些分析成分不仅适用于描述和编排舞蹈动作,也有助于辨别日常动作中的质量差异。例如,拳击和伸手拿东西在身体组织方面差异较小,但运动的强度、控制和时间不同,反映了不同的情感负载和动作意图。
在之前的工作中,研究者提出了一个基于加速度模式的框架,以促进机器人对动作的表达和解释,这是一种重要的动态特征,有助于实现人类与机器人之间的非语言表达交互。例如,机器人可以区分简单的工具性动作和富有情感表现力的动作。
然而,LMA在类人机器人上的应用目前取得的成功有限,因为这些机器人的电机速度不够快,无法实现Lourens等人和Barakova与Lourens提出的加速度模式。但在模拟机器人中,这些限制可能会被克服。Masuda等人基于LMA开发了一种方法,用于修改给定模拟机器人运动的定性方面,使其具有情感特征,该方法适用于任意全身运动,表明运动表现力不限于特定数量的专门行为,任何运动都可能包含有关情感的有价值信息。
Perugia等人则提出了另一种使用LMA的方式,即用于分析与能够对触摸做出反应并表达引发情感行为的机器人进行交互的老年人的行为。虽然这些研究中的机器人本身并不尝试识别运动,但运动的动力学仍然具有重要意义。
以下是一个简单的表格,总结了LMA的四个运动成分:
| 运动成分 | 描述 |
| ---- | ---- |
| 身体 | 涉及身体的组织和配置 |
| 努力 | 与动作的强度、控制、时间和流动有关 |
| 形状 | 关注身体形成的形状 |
| 空间 | 考虑动作在空间中的位置和方向 |
下面是一个mermaid格式的流程图,展示了机器人基于加速度模式理解人类动作的过程:
graph TD;
A[人类执行动作] --> B[机器人检测加速度模式];
B --> C[分析加速度模式];
C --> D[理解动作意图和情感];
D --> E[机器人做出相应反应];
综上所述,通过结合情感研究、舞蹈理论和LMA等方法,有望提升机器人对动作表现力的理解和表达能力,从而实现更自然、更丰富的人机交互。未来的研究可以进一步探索如何克服现有技术的限制,开发出更具适应性和智能性的社交机器人。
先有表现力,后有动作:具身交互作为机器人行为的内在表现力驱动
5. 现有研究的局限性与未来发展方向
虽然目前在机器人动作表现力的研究上取得了一定进展,但仍存在诸多局限性。
在情感与表现力方面,基本情绪理论在社交机器人研究中的应用虽有成果,但过于依赖准结构化交互,难以适应复杂多变的现实社交场景。而且基本情绪的具体集合尚未达成共识,这使得基于此的机器人情感表达和识别缺乏统一标准。而将情绪视为复杂自适应现象的动态系统方法和评价理论虽更符合实际,但在实际应用中,如何准确建模和量化这些复杂的情绪交互仍是难题。
在舞蹈理论和Laban系统应用方面,LMA在类人机器人上的应用因电机速度限制而受限,无法充分发挥其优势。此外,目前对于舞蹈中动作基元的研究虽有借鉴意义,但如何将舞蹈中的动作模式和语义准确地转化为机器人可理解和执行的代码,还需要更深入的研究。
未来的发展方向可以从以下几个方面展开:
-
技术突破
:研发更高速、更灵活的机器人电机,以克服类人机器人在应用LMA时的速度限制,使机器人能够更好地实现具有情感表现力的动作。
-
跨学科融合
:进一步加强情感研究、舞蹈理论、认知科学和机器人技术等多学科的融合。例如,结合神经科学对镜像神经元的研究,深入探索动作理解与语言、情感之间的关系,为机器人开发更智能的交互机制。
-
数据驱动
:收集大量的人类社交交互数据,包括动作、表情、语音等多模态信息,利用机器学习和深度学习算法,让机器人学习更自然、更丰富的社交行为模式。
-
场景拓展
:开展更多在不同现实场景下的机器人实验,如医疗护理、教育、娱乐等领域,检验和优化机器人的社交能力,使其能够更好地适应各种复杂的社交环境。
以下是一个表格,总结了现有研究的局限性和未来发展方向:
| 现有研究局限性 | 未来发展方向 |
| ---- | ---- |
| 基本情绪理论依赖准结构化交互,缺乏统一标准 | 技术突破,研发更高速电机 |
| 复杂情绪理论难以准确建模和量化 | 跨学科融合,加强多学科合作 |
| LMA在类人机器人上应用受限 | 数据驱动,收集多模态数据 |
| 舞蹈动作模式转化为机器人代码困难 | 场景拓展,开展不同场景实验 |
6. 具身交互在机器人行为中的重要性总结
具身交互在机器人行为中具有核心地位,它是机器人实现自然、丰富社交能力的关键。通过具身交互,机器人能够更好地理解人类的动作意图、情感状态,从而做出更合适的响应。
表现力与动作的紧密关系表明,动作不仅仅是完成任务的手段,更是传达信息、表达情感的重要方式。机器人只有理解了动作的表现力,才能真正融入人类的社交环境。
情感与表现力的研究让我们认识到,机器人的情感表达不应局限于简单的基本情绪,而应考虑到情绪的复杂性和动态性。通过结合动态系统方法和评价理论,机器人可以更好地处理情感交互,建立更深入的社交关系。
舞蹈理论和Laban系统为机器人理解动作表现力提供了宝贵的资源。舞蹈中对动作基元、语义和句法的研究,以及LMA对动作意图和情感的捕捉,都有助于机器人提升对动作的理解和表达能力。
以下是一个mermaid格式的流程图,展示了具身交互在机器人行为中的整体作用:
graph LR;
A[具身交互] --> B[理解动作表现力];
B --> C[识别情感状态];
C --> D[做出合适响应];
D --> E[实现自然社交];
A --> F[结合舞蹈理论和LMA];
F --> B;
A --> G[参考情感研究];
G --> C;
总之,具身交互作为机器人行为的内在表现力驱动,为机器人的发展开辟了广阔的前景。通过不断的研究和创新,我们有望开发出更智能、更具社交能力的机器人,使其在人类社会中发挥更大的作用。
超级会员免费看
2203

被折叠的 条评论
为什么被折叠?



