机器人集群的表达性运动

部署运行你感兴趣的模型镜像

集体表达:机器人集群如何通过群体运动传递信息

摘要

当需要为一组协作机器人实现去中心化行为时,受群体智能启发的策略通常会忽略人类操作员,赋予群体完全的自主性。然而,野外任务至少需要将群体的输出信息共享给操作员。遗憾的是,目前关于用户对群体行为与动态的知觉了解甚少,且尚无明确的最优群体交互方式。本文聚焦于利用群体的运动向用户传递信息:我们认为,基于群体运动来解释人工状态,可带来有前景的自然交互方式。我们实现了一套去中心化控制算法的语法,以探索其表现力。我们将运动的表现力定义为一种度量指标,用于衡量其在外观上是否自然、易读或易于理解。随后,我们将表现力与群体分布式行为的控制参数相关联。一项初步的用户研究表明,机器人之间的距离、时间与空间同步性与机器人系统感知到的表现力之间存在关联。接着,我们组织一个小规模用户群体,使用我们的算法语法设计具有表现力的运动序列,以传达内部状态。我们分析了他们的设计选择,并通过更大规模的用户群体评估了这些序列的解释性能。结果表明,部分内部状态被用户按预期感知,我们进一步讨论了影响解释性能的相关参数。

关键词 :人‐群交互,非语言线索与表现力,评估方法与新方法论,分布式控制,表现性运动

1 引言

随着机器人进入我们的世界,它们可能与人类互动和协作的应用领域日益增多。每个领域都为建立更直观的机器人关系提供了机会,通过提升机器人感知社会态度和采取表现性姿态的能力来实现。尽管机器人学通常涉及类人及仿生机器人,但近年来的技术进步也催生了新形态以及新的行动机会,有时甚至远离熟悉的运行模式。

机器人集群便是这些新实体之一,由大量可在编队中演化并适应多种环境的机器人组成。集群系统的鲁棒性主要源于其分布式控制和可扩展控制。目前已有越来越多低成本的商用集群系统问世,但由于基于机器人之间及其与环境之间局部交互的分布式控制具有复杂性,这仍限制了它们在实际应用中的推广 [1]。

领域特定编程语言[2]和软件架构[3]试图解决这些问题,以便研究人员能够专注于新颖的用户交互设计。在与人类交互方面,群体的特殊之处在于它们没有确定的物理形态:它们可以根据环境约束、内部策略以及用户发出的命令[4],形成涌现式的构型。因此,群体运动由生物实体的结构所定义并受其制约,并被视为一种生物运动类型[5]。然而,与人体运动等不同,群体运动没有一个刚性决定各组成部分之间关系的基础形态。这种可预测结构的缺失,以及观察者需要同时考虑多个个体(可能将其视为单一实体)的必要性,使得开发新方法来分析人‐群交互成为必需。这些方法应当研究群体运动的感知是否对移动群体的结构敏感,以及人类的理解是否与群体所表达的内部状态(例如系统警报或可供操作员使用的重要新信息)一致。与已经持续数十年的动画群体运动研究(例如雷诺兹 [6] 的重要工作)不同,针对机器人集群表达能力的研究才刚刚开始 [7]。目前,我们对于群体的运动如何影响用户的情绪反应 [8] 所知甚少。具体而言,我们尚不清楚赋予群体的状态(例如,它被视为一个单一实体、一群自主机器人,还是一个短暂的编队?)会如何影响其被感知的心理特征(如紧张、害羞、具有攻击性等),以及可能归因于其行为的表现力。对机器人集群的感知是否类似于观察鱼群或鸟群?机器人集群如何给人留下一种朝向目标组织化的集体运动印象?哪些集体特征支配着关于群体感知和社会状态信息的传递?

本文探讨了这些问题,并详细阐述了群体表达行为的概念。具体而言,我们研究了不同参数如何影响在群体行为中感知到的组织性,以及这种组织性如何转化为群体的表现力和识别诸如情绪之类的内部状态的可能性。这些问题通过两项涉及小型桌面机器人集群的用户研究加以探讨。本文分为四个步骤展开:首先介绍机器人集群的表达性行为(第2节);其次,描述用于研究群体表达行为的软件基础设施、控制算法以及实现的控制属性(第3节);第三,在第一次实验中,我们探究表达性行为与感知到的群体关键属性之间的关系(第4节),特别是检验归因于群体行为的表现力是否依赖于时间和空间同步性等属性,以及该表现力的变化是否与感知到的组织性参数的变化相关联;最后,在第二次实验(第5节)中,我们进一步研究机器人集群对内部状态的表达,使用由编舞者设计的表现性运动序列来表达特定情绪,评估这种表达的成功程度,并确定这些表现性序列所依赖的感知组织的参数。

2 机器人集群的表达性行为

半自主群体监控的一个重要问题是有效传达有关群体当前状态、未来状态以及人类输入对其行为影响的信息的可能性。这项工作源于近期在人‐群交互[5, 9–14]以及机器人非语言通信[15–19]方面的关键贡献。本节将讨论这两个领域,进而引出用于群体运动知觉的群体凝聚力这一核心概念。

2.1 人‐群交互

人‐群交互(HSI)与常见的人‐机器人交互(HRI)不同,因其涉及大量单元,并且高度依赖局部交互,从而产生群体行为 [10]。这种自组织和涌现行为相较于确定性和可预测的控制策略更难进行可视化。这也是当前商用集中式任务规划器设计范式的局限所在。例如,当在屏幕上实时渲染部署中的空中机队的位置时,操作员理解群体运动的难度会大于理解个体任务导向的目标。所有机器人的活动必须包含在一种支持性的可视化解释中,以促进操作员的决策过程 [20]。传达给群操作员的信息由群体朝向特定目标前进过程中的集体运动决定。这需要考察可能的群可视化构型,以确定最有效的信息传达方式,例如方向或危险提示。实现群行为直观可视化的一歩是识别用于人与机器人群体之间交互设计的不变量 [9]。

尽管适当的控制算法设计尚待完善,当前人‐ swarm 交互面临的挑战之一是群体的状态估计和群可视化 [10]。一个非常重要的问题是人类是否能够理解群运动动力学[11]并对其做出恰当反应,从而引导设计出与人类认知能力的理解相兼容的群运动动力学。

人类通常擅长识别集体运动模式 [13]。然而,由于人类注意力可能会波动,且人类工作记忆的容量有限,由于认知能力有限,单个操作员能够控制的机器人数量也受限[12, 21]。事实上,在需要操作员识别某种常见群行为(例如群集)的任务中,他们报告称采用了一种整体性方法来知觉涌现群行为所固有的集体运动[13]。沃克和刘易斯[13]观察到,操作员会采用诸如“模糊视线”和/ 或“观察全局模式的出现”等策略。这些策略是认知系统在群体交互过程中应对控制工作负荷增加的反应 [22, 23]。在人‐ swarm 交互这一新兴研究领域,研究人员经常通过用户研究来评估工作负荷和系统性能[5, 14]。例如,赛菲尔特等人[5],研究了运动知觉在集群构型评估中的作用,他们发现,对于有组织的群体,其辨别能力优于无结构的混乱系统,但低于刚性结构运动的辨别能力。因此,为了考虑群体在人类交互方面的特殊性,必须考虑到其分布式特性,并发展适当的概念来确定一个群体可能产生的社会影响程度。据我们所知,以往的研究很少关注人类如何基于群体内部状态的表现来知觉一个群体。

2.2 人‐ swarm 交互中的非语言交流

为了传达有关群体状态的信息,一种灵活的策略是使用用户能够直接识别而无需记忆的象形表达方式,例如每个机器人上的顶部LED灯[15],或让机器人发出声音[24]。请注意,后者是利用声音帮助用户察觉群体中的故障,而非共享高层次的状态信息。为了更广泛的应用,需要明确定义群体所传达的信息,这是一项非平凡的任务,卡波等人 [25]通过定义群行为描述符来解决该问题,具体包括:1‐ 动作,即整个集群的全局运动;2‐ 目标,即集群的目的地;3‐ 形状,在整个运动过程中保持的几何结构;4‐ 机器人的航向;以及5‐ 方式,即轨迹变化赋予运动的不同动态属性。研究人员模拟了超过1000种可能的行为描述符组合,但未开展任何用户交互研究。形状描述符对于一般的群体运动具有局限性,因为它排除了使用分布式路径规划算法的可能性,而这类算法无法在整个运动过程中维持固定形状。除了通信和监控问题之外,群体状态的表示也涉及社会存在感的问题。随着机器人集群将在社会领域内发展,因此需要建立超越符号和标志的交流方式。非语言行为、社会态度和情感表达是建立社会联系的重要组成部分[26]。为了形成并维持这种联系,传统机器人学已探索了多种路径。通过模仿人类轮廓和姿势结构,类人机器人可以结合身体姿势、面部和手势表达来传达情绪状态[17]。然而,更为抽象的高级运动模式也有助于情感表达,而无需具备类人外观,甚至不需要表达特定情绪[27]。例如,运动学特征已被证明参与动作的情绪评估[18, 28]。运动特征如路径曲率和加速度与不同水平的感知唤醒度和效价相关[19, 29]。社会存在感各种模态的共同要素是表现力。一种表达性行为可被视为成功传递某种情绪、态度或某种特定行动与反应倾向的行为。西蒙斯与奈特[16],指出,表现力代表“传达智能体对其任务或环境态度的能力”。运动的表现力决定了该运动看起来有多自然、易读或易于理解。因此,表现力在很大程度上决定了与机器人(包括机器人集群)进行直观和透明交互的能力。

由于机器人集群的分布式特性,表现力的概念必然与传统方法中的表现力有所不同,后者将表现力与手势和形态特性联系在一起。群体没有身体或身体部位来表达情感或态度。由于缺乏明确的物理形态,群体可以重新配置并适应来自用户的不同的环境和命令。在这种情况下,观察者必须考虑由多个个体行为所产生的涌现特性,例如个体倾向于彼此靠近,或采用相似的速度。因此,确定群体的表现力不同于考察单个机器人的运动,甚至也不同于考察集中控制的小群体机器人的运动。

2.3 将群体感知为连贯实体

不依赖于身体和运动知觉,评估群体行为至少需要三个计算的主要方面:1. 整体编码,2. 知觉分组,以及 3. 运动特征感知。为了传达群体的内部状态,必须首先理解是什么因素促成了用户将群体感知为一个单一实体。

关于整体感知的研究(1)已经确定,与单个物体相比,物体会以一种质上不同的方式被表征[30, 31]:人们能够从一组物体中快速提取有关大小、方向、运动方向,甚至与面部表情相关的情绪等社会特征的信息[32]。观察构成群体的机器人的行为时,人们可能会提取出统计摘要,例如机器人运动的平均速度或平均方向。

将群体知觉为一个连贯的整体(2)也由格式塔因素决定。当视觉场景中的元素不仅彼此接近,而且以相似的速度和方向一致地移动时,视觉系统会将其整合为同一结构的组成部分[33, 34]。这种共同命运的特性决定了能否将群体视为一个凝聚的整体,并赋予该整体一系列定义其行为的特征。格式塔因素还决定了某些动态运动模式,例如追逐感知[35, 36]:当两个或多个移动物体给人以相互追逐的印象时,这可能促成了群体的表达性行为。一般来说,快速检测速度或方向变化之间的时间关联[37],为识别群体中机器人之间的有意义互动提供了知觉基础。

运动学与动力学特征(3)构成了视觉系统在观察群体行为时获取的第三类信息。运动特性可能与情绪表达 [28, 39]相关。虽然总体的运动活动水平和空间范围被认为是区分情绪类别的关键特征,但运动模式的变化可能为进一步区分效价与唤醒度水平提供额外依据。迪茨等人[7]最近研究了此类变化对群体行为知觉的影响,发现速度和平滑性的增加对所感知的情绪状态具有显著影响。

整体编码、知觉分组和运动特征感知共同作用,产生了对表征群体的不同全局状态的知觉。这些状态可能在感知到的凝聚力(即机器人是否呈现出一个凝聚的整体)和感知到的组织性(即机器人是否呈现出表现出有组织行为的外观)方面有所不同。

表1 :控制机器人集群作为连贯实体的机器人群体表征的参数。

聚合 将机器人视为整体的倾向 彼此保持接近
同步 将机器人视为整体的倾向 同步其运动
领导性 将机器人视为整体的倾向 跟随其中一员
图形 将机器人视为整体的倾向 共同形成一个图形

传统上,关于群行为的文献区分了两个不同的参数,用于描述将群体表示为单一实体[40, 41]:一个表示个体倾向于彼此保持接近的内聚性参数,以及一个在速度或对齐方面的同步参数。

在本文中,我们区分了四种感知组织的参数(见表 1):聚集参数,对应于观察者对构成群体的机器人倾向于聚集在一起而非分散的印象;同步参数,即观察者对机器人的运动趋于一致的印象;领导性参数,涉及观察者对机器人正在跟随或追逐群体中某一成员的印象;以及图形构成参数(仅限第二项研究),即观察者对机器人正在形成某种图形的印象。更具体地说,我们将使用凝聚性这一术语作为关键概念,用以指代由上述三个参数相互作用所产生的全局属性。这种感知到的凝聚性可被视为将机器人集合表现为一个连贯实体的前提条件,该实体有可能通过其行为表达内部状态。

2.4 研究问题和一般假设

本文旨在评估群体表达性行为的来源。这一研究需要实现一个灵活的群体控制架构,以设计去中心化的群体运动(第3节),并构建评估工具来分析观察者如何感知和评估这些运动。基于这两类工具,我们能够确定由去中心化控制算法决定的运动可观测变量与集体运动所具有的特性之间的关系。

示意图0

图1 :所探讨的集体表达结构:从群体控制算法(1)中,我们提取出常见的控制属性(2),以评估群体感知的组织元素(3),并最终将这些元素与群体的凝聚性、表现力和情绪状态(4)相关联。

本研究关于集体表达的架构由关键概念的四个层次构成(图1): 1. 实现了五种去中心化群控算法以生成表现性群行为(第3.4节); 2. 我们确定了一组控制属性,用于调节这些算法,并基于它们设计群体运动序列(第3.4节); 3. 针对用户对感知组织参数的评估(在第2.3节中介绍),对这些序列进行了研究; 4. 这些参数及其相应的量表可用于确定群体被赋予的整体凝聚力、其运动所关联的表现力以及可识别的情绪状态的某些感知决定因素。

鉴于需要考虑多个单个机器人,我们推测观察者必须先将群体视为一个单一实体,然后才能赋予其行为任何性质。因此,我们认为,要使表现力得以发展,必须达到一定程度的感知到的凝聚力;并且我们预期会观察到,将群体知觉为连贯实体的程度(通过组织性参数来衡量)与赋予群体行为的表现力评分之间存在关联。当专家(编舞者)设计群行为以传达情绪状态时,我们预期这些组织性参数将在集体运动被引导以产生可识别情绪的方式中发挥作用。

我们提出以下假设:

  1. 将群体视为一个连贯且稳定的实体,应取决于能否识别出群体运动中的聚合、同步和领导性参数(第一次实验);
  2. 表现力还应与聚合、同步和领导性的参数相关,因为群体要被视为单一实体,必须具备足够的组织性。然而,如果过度的组织性导致运动模式僵化(第一次实验),则可能对整体表现力产生不利影响;
  3. 用户能够根据由表情动作领域的专家(例如编舞者)设计的群体运动,来区分机器人集群的内部状态(如态度或情绪)(第二次实验);
  4. 从内部状态设计的一组表达性动作的识别性能,也在某种程度上依赖于对群体行为中组织特性的感知(第二次实验)。

3 群体表达行为的实现

关于群体智能的文献涵盖了大量用于机器人互联群体的去中心化控制算法[42]。在这一知识体系中,交互研究通常一次只关注单一的控制机制,以关联控制输入与用户感知。相反,我们的兴趣在于群体运动属性与用户感知之间的关系。我们实现并研究了多种控制算法所产生的运动。这些运动随后可与用户感知相关联进行分析。设计去中心化群体运动的灵活且通用的系统需要专门的工具。在本节中,我们介绍了我们的软件基础设施,该基础设施利用一种针对群体的、适用于所有控制算法的统一编程语言。接着,我们可以详细说明本研究中实现的控制算法,以及从生成的运动中提取的运动属性。

3.1 软件生态系统

即使是已知的群体算法的实现也可能非常具有挑战性,尤其是考虑到群体本质上是去中心化系统,其行为仅基于局部交互。据我们所知,只有一种解决方案能够提供可移植性、可扩展性和快速的开发时间:Buzz。Buzz既是一种编程语言,也是一种用于运行其脚本的虚拟机。它由我们的研究团队于2016年创建,旨在加速群行为[2]的实现。Buzz提供了特殊的结构来处理三个核心概念:a) 共享内存(虚拟痕迹),b) 群体聚集,以及 c) 邻居操作。

Buzz虚拟机(BVM)必须在群体的每个单元上运行,并且使用完全相同的脚本,但由于该语言是平台无关的,因此单元可以不同(即异构群体)。示例脚本在线提供 [43],,编译器和BVM的代码也一并提供[44]。本节中描述的行为同样是开源的[45]。

使用Buzz,我们确保代码可以部署在多种硬件平台上。在这项工作中,我们还利用了其群体级原语:虚拟信息素[46]和邻居操作。我们使用前者(在整个群体中共享的元组空间)来就群体范围内的变量达成一致,例如群体范围状态机中的当前状态。我们使用后者(一种局部通信系统),因为它是大多数群体智能算法的基础:局部交互。

3.2 控制算法

示意图1

图2 :本研究中实现的常见群体行为:a‐ 聚合,b‐ 图形成,c‐ 循环追逐,d‐ 自主部署,e‐ 群集。

如图2所示,我们在Buzz脚本中实现了一组五种常见的群行为:聚合、基于图形描述的编队、循环追逐、自主部署和群集。所有脚本仅需要与它们的邻居进行局部交互:对于群体中的n个机器人,每对机器人知道bij(机器人i与j之间的方位角)以及dij(两者之间的距离)。在接下来的小节中,我们将详细介绍每种算法如何从这些输入中计算,有时结合共识机制,每个机器人的速度向量。提到了它们在两个实验中的使用情况,例如与哪种情绪状态(恐惧、愤怒、快乐、悲伤、惊讶或厌恶)相关联。

在Buzz脚本中,该速度向量是用于底层硬件控制以驱动机器人的函数的参数。最终,尽管每个机器人的具体路径尚未确定,但群体运动参数和目标位置已被编写进脚本。

3.2.1 群集

在生物群行为的最流行形式化方法中,势函数是一种简单而灵活的控制方法。平均势力算法通常被称为群集行为。每个机器人计算一个虚拟力向量:

$$ f= k \sum_{i=1}^{n} f_i(d_i)e^{j\theta_i}, $$

其中 $ \theta_i $ 和 $ d_i $ 分别表示第i个感知到的障碍物或机器人 的方向和距离,函数 $ f_i(d_i) $ 源于一个人工势函数。最常用的人工势之一是伦纳德‐琼斯势,已针对我们的物理系统进行调整,如图3所示。该势方程的两部分表示仅由两个参数驱动的吸引子和排斥效应:目标距离(D)和增益 (ϵ)。在此控制方法中,目标(目标位置)被表示为同时影响整个群体的吸引子。

通过手动调节函数的增益,我们生成了序列以突出第3.2节中的控制属性。该控制算法所提供的可用运动的广泛范围使其成为用户研究第一阶段的理想候选(见第 4节)。随后,在我们的用户研究第二阶段,群体选择群集作为代表sadness的控制算法(见第5节)。

示意图2

图3 :适用于轮式机器人编队的伦纳德‐琼斯势。其中“‐”和“+” 区域分别为排斥和吸引部分,其枢轴点由参数t设定。D是两个机器人之间的距离, ϵ是作用在势能上的控制增益参数。

3.2.2 聚合

聚合是一种简单的行为,它将所有机器人聚集到一个点,通常是群体中心。正如萨欣[47],所提到的,这种行为在生物系统中经常被观察到,并且是大多数集体行为的前提条件。已有研究表明,无需在机器人上进行任何计算,仅通过将速度向量直接调整为邻居的平均相对位置即可实现聚合[48]。我们采用了一种更形式化的聚合模型,其中每个机器人的线速度和旋转速度分别由以下方式给出:

$$ v_i= \frac{\sum_{j} d_{ij}}{n}, \quad \text{and} \quad \omega_i= \frac{\sum_{j} b_{ij}}{n}, $$

计算一个梯度以最小化附近机器人之间的距离和方位,最终收敛到同一点。为了迫使群体重新聚集到另一个位置,我们添加了一个分量:

$$ v_i= \frac{\sum_{j} d_{ij}}{n} + d_{it}, \quad \text{and} \quad \omega_i= \frac{\sum_{j} b_{ij}}{n} + b_{it}, $$

其中$ d_{it} $和$ b_{it} $分别表示到目标会合点的距离和方位。聚合是焦点群体在第二次用户研究中选择的控制算法,用于表示恐惧(见第5节)。

3.2.3 循环追逐

即使在最简单的机器人集群形式中,缺乏计算资源,除了之前介绍的聚合行为外,还显示出两种额外的行为源自局部反应式控制:分散和循环追逐[48]。追逐是许多机器人应用(如巡逻)中的重要行为围绕一个兴趣点、入侵者或扫描建筑物。对追击瞬态的进一步分析显示了更复杂的模式,这些模式在表现性运动方面具有重要潜力[4]。在此工作中,我们选择了一个不包含瞬态的形式化模型,因此每个机器人的线速度和旋转速度由以下给出:

$$ v_i= f b_{ip}, \quad \text{and} \quad \omega_i= v_r i - k \cos(b_{it}), $$

其中,r为到兴趣点的距离,$ b_{it} $为朝向该点的方位角,$ b_{ip} $为朝向圆形中机器人i前一个机器人(即前方最近的机器人)的方位角,f和k为循环追逐行为的参数,类似于久保等人[49]所使用的参数。循环追逐是焦点小组在第二次用户研究中选择用于表示快乐的控制算法(见第 5节)。

3.2.4 图形成

群体智能不仅受到生物系统中观察到的行为的启发。如前所述,分布式算法利用与邻近机器人的局部交互,因此在很大程度上依赖于群体网络拓扑。因此,许多算法的根源来自网络工程,例如关于基于图的编队的研究工作。有向图由具有前驱和后继的节点组成(见图2‐b),这种表示方式有助于建模控制结构、信息流以及误差传播[50]。挑战在于如何从给定的形状逐步达到目标编队,只要能够为该形状生成一个有向图即可。

研究论文我们的实现方法将目标形状表示为一个无环有向图,其中每个机器人可通过两个已就位的机器人(前驱节点)作为参考,以确定自身的位置。我们假设所有机器人均具备该图结构表示,但最初未被分配到特定位置。整体形状动态且迭代地构建:每个新机器人仅在获得其中一个父节点通过局部通信授予的许可后,才加入形状。所得到的算法完全去中心化且并行:多个机器人可在任意时刻加入形状的不同部分。该方法在[51]的研究中有详细描述。简而言之,当一个机器人接近已在编队中的另一个机器人时,它会依据已知的图结构“请求”成为其后继节点,若获准许,则向有向图中下一节点的相对位置移动。尽管该控制结构在人‐ swarm 交互中对具象表示(图标或符号)具有巨大潜力,但我们将其应用限制于抽象几何 shapes 以专注于运动学。

群体的图形形成是焦点小组在第二次用户研究中选择的控制算法,用于表示厌恶(在“C”形及其镜像之间交替)。(见第5节)

3.2.5 自主部署

本研究实施的最后一种控制算法源自计算几何。该方法不仅考虑机器人的相对运动,还将周围区域在群体成员之间进行划分,这一过程称为表面镶嵌。某些主要应用场景得益于这种方法,例如搜救任务和传感器网络的部署。沃罗诺伊镶嵌[52]是一种已被广泛研究用于多机器人部署的算法。该算法通常将机器人初始位置作为种子 输入到镶嵌问题中,然后对区域进行划分。其逻辑很简单:在每两个机器人之间的中点创建边界线,并在这些线与其他边界线或区域边界相交时停止延伸。我们在 Buzz中集成了扫描线算法,即著名的福琼算法,这是从 一组种子[53]中提取单元线最高效的方法之一。然后我们 使用用户定义的凸多边形边界对开放的单元进行裁剪。自此之后,每个机器人都能知晓自身单元的边界范围。

为了实现机器人在区域内的均匀分布,我们采用简单的梯度下降法向每个单元的质心移动,如[54]所示。每个机器人根据其邻居相对位置的更新信息重新计算镶嵌结构;该方法对丢包和环境动态均具有较强的鲁棒性。在每个机器人所属的单元内,用户可自定义任意方式来确定机器人的目标,而非仅限于质心。例如,在追求最大覆盖的同时探索区域时,可以在每个单元内生成随机目标。

自主部署是焦点小组在我们的第二次用户研究中选择的控制算法,用于表示愤怒(随机目标)和惊讶(均匀分布)(参见第5节)。

3.3 硬件选择

本研究选用的机器人平台必须具备便携性,并尽可能避免因拟人化或拟物化外观而产生的偏差。我们选用了 Zooids[55],,这是一种小型桌面式圆柱形机器人,直径为2.6厘米,通过天花板投影仪发射的结构光进行定位。

尽管我们的行为脚本可以移植到任何硬件平台(如上所述),但我们选择了Zooids,因为其设置时间最短、制造成本低、开源控制器代码以及操作简单。尽管抽象形状在人机交互研究中不太常见,但已有示例表明,它们例如可以减少用户的尴尬[56]。我们建造了一个充电站,并制作了足够多的Zooids单元以组成两组:一组充电时,另一组可执行任务。

Zooids 上实现的 Buzz 底层执行功能会调用其嵌入式控制器。为了能够从运动质量的角度探索机器人运动的表现力,我们操控了控制器的一些底层变量:

  1. 最大速度 会改变群体运动的平均速度,但不会导致系统不稳定(而调整控制器增益可能会导致不稳定),因为Zooids控制器专注于小范围精确移动以到达目标,在大位移情况下会饱和;
  2. 人工的运动 命令延迟使我们能够操控运动的同步性,例如在群体中创建隐式领导者。

3.4 控制属性

每种算法都有其自身的参数,这会迅速增加分析这些参数影响的复杂性。此外,移动群体系统中的简单行为 (如群集和循环追逐)通常会导致涌现的瞬态 [4]。为了推导和解构由一组控制参数产生的这些状态,必须运行大量仿真。相反,为了影响感知组织性和表现力的水平,我们设计了一组高层运动控制属性。这些控制属性决定了机器人之间的客观相互依赖性。这些关系是我们对感知组织性和表现力进行评估的基础:

  1. 机器人间平均距离,
  2. 群体的空间同步性,即机器人作为一个凝聚群体移动,
  3. 群体的时间同步性,即机器人同时移动。

每个属性通过行为控制参数被定位在连续范围(近/远,同步/不同步)上。例如,在伦纳德‐琼斯势场中单独增加距离(目标)参数,会导致机器人间距离不稳定且不可预测。随着时间的推移,因此必须同时操控epsilon/目标对,以针对每个机器人间距离获得稳定的编队。利用这两个参数范围内的不稳定谱,还可以影响群体的空间同步性。换句话说,给定的参数对越不稳定,机器人的运动就越稀疏。时间同步性则需要在势函数定义中使用另一个控制参数:每个机器人感知目标吸引子的延迟或滞后。通过延迟目标吸引力对某些机器人的影响,我们可以影响时间同步性。例如,领导者机器人可以比群体中的其他机器人提前数秒察觉到目标吸引子,从而打破时间同步性。这三个控制属性用于生成没有内部状态(或概念意义)的动作,以便在我们的第一个实验中客观地研究群体的凝聚性和表现力。然后,在第二个实验中,我们从编舞者设计的动作中提取这些属性的值。我们通过对旋转速度的标准差计算来估计空间同步性的数值,通过从群体中得出的最大个体速度差来估计时间同步性,以及通过到群体中心的平均距离的标准差来估计机器人间距离。

4 第一次实验:感知到的组织 对集体表达的影响

为了增进我们对机器人集群中感知组织性与表现力之间关系的理解,我们开展了一项用户研究,以验证假设1和假设2(见第2.4节)。根据第3.4节中详细描述的属性的高值和低值,我们生成了八种抽象的非具象运动序列,并通过参与者在实时会话中给出的评分,评估这些序列的感知组织性和表现力水平。

4.1 参与者

我们招募了27名具备良好舞蹈知识和经验的参与者。针对群体运动感知的本项研究,我们有意选择这一特定人群,以深入了解每种群体运动状态之间的细微差异:舞者和编舞者均属于身体运动方面的专家,无论其对象是人类还是人工的。我们相信,从他们的回答中得出的结论能更好地帮助我们为更广泛的用户群体定义运动参数。在27名参与者中,4人自我认同为男性,22人为女性,1人为 “其他”;其中三分之二是舞蹈专业学生(19人),其余为自由职业者(8人)。参与者未因本研究获得任何经济补偿,而是出于对与机器人系统进行自然交互的好奇心而参与。该研究方案已获得巴黎第八大学研究委员会和蒙特利尔综合理工学院伦理委员会的批准。参与者签署了知情同意书后参与了本研究。

表2 :六个实验变量。

空间 同步性 S+
S-
机器人倾向于保持 紧密聚集
机器人倾向于分散
标准差 旋转的 速度
时间 同步性 T+
T-
机器人倾向于移动 同时
机器人倾向于跟随
一个领导者
最大 机器人速度差 从群体中
机器人间 距离 D+
D-
机器人正在移动并具有 之间的大距离 them 机器人正在移动并保持 之间的小距离 them 机器人的标准差 到…的距离 质心

4.2 方法

为了说明多个连续会话中的不同运动模式,我们在两组各六个Zooids机器人之间进行交替使用。如表2所示,之前描述的三个高层运动属性被用作二进制放置,生成8种可能的组合,即8种不同的运动脚本。每个运动都遵循相同的目标序列(见图4):(1)从A点到B点,(2)从B点到C点,(3)从C点到B点,(4)从B点到C点,以及(5)从C点到A点。

图4 : 六个Zooids朝用户移动以形成一个图形。绿色字母显示了每个运动序列所覆盖的连续目标。

参与者被要求坐在 Zooids 进行演示的桌子前。他们在观察每个序列后,需要在平板电脑上回答 14 个问题 (提供法语和英语版本)。每个运动脚本仅向参与者播放一次,但按照三种可能的顺序之一进行: 1‐2‐3‐4‐5‐6‐7‐8、5‐6‐7‐8‐1‐2‐3‐4 和 1‐2‐7‐8‐3‐4‐5‐6。当参与者确认所有问题均已回答后,由实验人员依次触发运动序列。实验人员还事先说明,将会自动生成数量未知但经过相同目标的运动序列,这些序列具有不同的运动属性。

为了评估参与者对群体所表现出的凝聚性和表现力的评价,参与者完成了一份包含三个不同量表的问卷 (见表3):(i)用于评估对群体行为所感知的组织性的量表;(ii)用于测量对群体凝聚性评价的量表(即群体是否被视为一个连贯且稳定的实体);以及(iii)用于评估群体行为表现力水平的量表。对于各个量表中的每一项,我们采用七点李克特量表,响应范围从0(强烈不同意)到6(强烈同意)。

表3 :用于评估群体所具有的组织性、凝聚性和表现力的三个量表。

Organization

  • 在0到6的量表上,表明你同意以下陈述:
  • 机器人倾向于留在群体中
  • 机器人倾向于同步它们的运动
  • 机器人倾向于跟随它们中的一个

Cohesion

  • 在0到6的量表上,指出你在多大程度上同意以下陈述:机器人形成一个连贯且稳定的群体,并且似乎在进步的同时相互连接

Expressivity

  • 在0到6的量表上,您会如何评价机器人集群的表现力?

4.3 结果

本研究在一个相对较小的数据集(27名参与者)中呈现出大量并列排名。我们使用肯德尔τb相关性检验来评估数据集中每个参数的贡献。我们从凝聚性和表现力的度量中提取出感知上的组织结构。由于无法假设表现力得分之间以及凝聚性得分之间的心理距离是相等的,因此我们采用有序逻辑回归来考察空间同步、时间同步和距离对感知凝聚性和表现力的影响。

感知到的组织的参数如何影响群体被赋予的凝聚性?

我们发现凝聚性与保持在群体中的倾向之间存在正相关关系:机器人感知到的保持在群体中的倾向越高,越可能与更高的感知到的凝聚力相关(τb= 0.398, ρ< 0.001)。同样,我们发现机器人感知到的同步它们的运动的倾向越高,越可能与更高的感知到的凝聚力相关(τb=0.440, ρ< 0.001)。最后,我们发现机器人跟随其中一员的感知到的倾向与群体被赋予的凝聚性之间存在显著的正相关关系(τb=
0.309, ρ< 0.001)。

感知组织的参数如何促进群体的表现力?

表现力与机器人保持群组的感知到的倾向之间的相关系数相较于凝聚性而言重要性较低,但我们仍然发现存在显著的正相关关系(τb= 0.148, ρ= 0.008),以及机器人跟随其中一员的感知到的倾向也存在显著正相关(τb= 0.197,ρ< 0.001)。尽管保持群组的倾向以及感知机器人之间追逐关系的可能性似乎有利于群体的表现力,但过高的同步水平可能对这一指标产生负面影响,这一点从机器人移动同步的感知倾向与表现力之间缺乏显著关联可以得到印证(τb= 0.033, ρ= 0.585)。

运动控制属性如何影响群体的表现力和凝聚性?

时间同步性对群体的表现力有显著影响(见图5)。在时间异步条件下,表现力增加的可能性是原来的 1.647倍(95% CI,1.012至2.681)(χ²(1) = 4.028, ρ= 0.045)。然而,我们未发现空间同步性存在影响:空间异步条件被视作具有表现力的可能性与空间同步条件相似(优势比为0.698,95% CI,0.430至1.134), χ²(1) = 2.107, ρ= 0.147。同样,大间距条件被视作具有表现力的可能性与小间距条件相比没有差异(优势比为1,389,95%置信区间为0.855至2.256), χ²(1) = 1.761,p= 0.184。

与表现力相比,凝聚性得分主要受空间同步性的影响(见图6):在空间异步条件下,凝聚性降低的可能性增加了0.321倍(优势比95%置信区间为0.194至0.530; χ²(1) = 19.725,p<.001)。时间同步性和距离对凝聚性得分无显著影响:时间同步性(优势比0.661,95%置信区间0.407至1.075; χ²(1) = 2.787, ρ= 0.095);距离(优势比0.859,95%置信区间0.530至1.392; χ²(1) = 0.381, ρ= 0.537)。

图5 :不同空间同步性(S+/S‐)、时间同步性(T+/T‐)和机器人间距离(D+/D‐)条件下表现力的平均得分。

图6 :不同空间同步性(S+/S‐)、时间同步性(T+/T‐)和机器人间距离(D+/D‐)条件下凝聚性的平均得分。

4.4 讨论

在第一次实验中,我们假设群体的表现力依赖于从机器人运动中产生的凝聚性感知,而这种凝聚性本身又取决于感知到的聚集、同步和领导力等参数。我们验证了以下假设:凝聚性评分(衡量人们认为群体作为一个连贯且稳定实体的程度)与识别出聚集和同步时刻的可能性相关。我们确实发现,我们测量的三个参数(倾向于将机器人视为保持在群体中、同步其运动以及跟随一个领导者)均与凝聚性评分呈正相关。正如所预测的,这些参数与表现力之间的关系略微复杂一些。被认为具有表现力的运动模式更有可能与更高水平的聚合以及给人的印象是机器人正在跟随一个领导者,但我们并未发现其与同步性评分(包括时间和空间同步性)存在显著相关性。我们还发现,更有利于表现力的条件是运动在时间上异步的情况,这证实了高同步性可能对表现力模式产生负面影响的观点。值得注意的是,与表现力评分不同,凝聚性评分主要受空间同步性影响,空间异步条件被认为凝聚性较低。我们观察到这两个参数之间存在一种有趣的关系:我们假设群体要被视为具有表现力,必须具备一定程度的凝聚性(因此表现力与聚合和组织性参数呈正相关),但就时间同步性的影响而言(对表现力有害)和空间异步的影响而言(对凝聚性有害),凝聚性和表现力则表现出分离现象。

5 第二次实验:使用集体运动表达情绪状态

先前已验证的群体属性(凝聚性和表现力)现在可与表现性序列的设计相关联:我们开展了第二次用户研究,以验证假设3和4(第2.4节)。通过群体运动进行情感表达的领域在很大程度上尚未被探索,我们尚不清楚哪些运动模式负责表达特定情绪。因此,我们指派一组编舞者从零开始设计表现性序列,根据他们的判断,这些序列将唤起六种基本情绪中的一种:快乐、悲伤、恐惧、愤怒、厌恶和惊讶 [57]。随后,我们测试了普通观察者识别这些表现性序列所对应情绪的可能性,并使用之前实验中制定的感知到的组织性的度量方法,来确定情绪识别(以及情绪状态之间可能存在的模糊性)在多大程度上与组织性模式的变化相关。

5.1 参与者

在设计阶段之后,本项第二项研究完全在线上进行。参与者通过直接发送电子邮件邀请以及在社交媒体上宣传该研究进行招募。我们共联系了41名参与者,其中男性占34%,女性占66%。与之前的研究主要关注学生和年轻专业人士不同,本次研究的参与者多数年龄在30岁以上(占59%)。参与者未因本研究获得任何经济补偿,研究方案已获得两所大学的伦理委员会(巴黎第八大学和蒙特利尔综合理工学院)批准。在开始在线问卷之前,所有参与者均需签署本研究的知情同意书。

5.2 方法

为了创建这些序列,我们让三位编舞者使用由六个 Zooids组成的小型桌面群体来设计六种表现性运动。实验分为两个部分:首先,我们召集了一个小型焦点小组来设计表现性序列;然后,我们将结果展示给更多的参与者。

我们并未期望运动序列设计者具备良好的去中心化编程知识,因此我们设计了一个简单的软件界面以简化他们的迭代设计过程。第3.2节中详述的所有控制算法均可由用户通过该界面进行选择,并通过诸如最大速度、整体群组形状、机器人间距离和时间同步性(领导性)等参数进行调节。每位编舞者分别与一名程序员练习了各种控制动作的使用。随后,编舞者们共同会面,商议如何最好地表现六种情绪展示Zooids的表现性运动:恐惧、快乐、悲伤、惊讶、厌恶、愤怒。这些情绪被认为是最容易命名(自我识别)的[57]。随后,我们进行了一个小规模(六名参与者)的定性评估,以确认每种设计序列所传达的情绪,并根据参与者的反馈进行了微调。最终的六种Zooids情绪在控制算法和速度方面的细节见表4。所有六种序列的合集视频可在线获取¹。

表4 :基于第3.2节中定义的控制算法和机器人的设定速度所设计的六种表现性运动。

情绪状态 控制算法 速度
Fear 聚合 Fast
快乐 循环追逐 平均
悲伤 群集 Slow
惊讶 均匀部署 Fast
厌恶 图形成 平均
愤怒 随机部署 Fast

¹ https://www.youtube.com/watch?v=rchI1HDYTr8

参与者在观看每个序列后被要求完成一份问卷(包含11个七点李克特量表上的问题)。为了在线进行这一部分,我们使用Zooids拍摄了六个短视频序列。每个序列对应六种情绪之一。对于每个表情序列,参与者需要通过六个七点李克特量表来评估该序列是否引发了恐惧、惊讶、厌恶、愤怒、快乐和悲伤。参与者还需要使用第一次实验中提出的三个感知组织性量表,以及第2.3节中引入的第四个量表——即倾向于将机器人视为整体形成一个图形——来评估这些序列。

5.3 来自编舞者的反馈

我们承认,六种序列的设计受限于可用的控制算法和所选的控制属性。只有通过比我们所实现的更多的控制选项才能缓解这一限制:我们认为这会给系统带来一定程度的复杂性,可能会影响设计者。然而,与三位编舞者的讨论突显了他们设计选择的特点以及他们没有感到受限。编舞者们在愤怒、恐惧、惊讶和快乐的情绪表达上迅速达成了一致。他们为愤怒选择了快速随机部署,因为机器人看起来“疯狂”,即运动毫无组织、缺乏明显逻辑,有时甚至相互碰撞。恐惧对他们来说最容易设计,这也反映在上述结果中:聚合似乎是显而易见的选择。惊讶和快乐最终都用圆形来表现,但这并非刻意为之。快乐使用循环追逐的方式,类似于围绕篝火的部落舞蹈,象征群体的庆祝。而惊讶则采用均匀自主部署,对他们而言,这是一种更抽象的表现方式,象征迸发或心跳突然加速。厌恶是最难表现的情绪:最终,通过图形成控制形成的“C”形,旨在营造出一种远离中心(用户焦点)的陪审团印象,并从其高尚道德立场的角度偶尔做出低语(抖动)的姿态。最后,焦点小组始终未能就悲伤的表现形式达成一致,但他们认为所选行为(从右到左靠近用户的群集运动)具有安慰性,这正是我们在悲伤时常寻求的行为。

表5 :为每个序列计算的控制属性。旋转速度的标准差较小表明空间同步性较高,最大速度的差异较小表明时间同步性较高,到群体质心的平均距离的标准差较小表明机器人间距离较小。

表达序列 空间 同步。
(弧度/秒)
时间 同步。
(厘米/秒)
机器人间
机器人 距离 (cm)
fear 0.66 7.6 4.08
快乐 0.77 1.1 16.81
悲伤 0.53 3.9 14.7
惊讶 0.65 16.7 15
厌恶 0.4 0 12.1
愤怒 0.74 42.5 24.3

基于高层算法选择和少量控制属性选项的设计方法在本次实验中比第一次实验中生成运动序列变化所需的参数受控调节更加直观。然而,我们从生成的序列中提取了度量,以量化底层的控制属性。为了确保这些值完全适用于呈现给参与者的视频序列,我们提取了所有机器人的位置从每个序列中,利用以30赫兹记录的每个机器人位置,我们计算了所有机器人的速度向量以及整个群体的平均速度向量。空间同步性通过每个机器人旋转速度的标准差来衡量,并在整个序列上取平均值。标准差越大,空间同步性越低。时间同步性通过整个序列中群体最大速度与最慢成员之间的最大差异来衡量,差异越大,时间同步性越低。最后,机器人间距离通过群体的空间分散性来衡量:即每个成员与群体中心之间距离的标准差。表5列出了所有序列中各控制属性的数值。由于聚合和随机部署算法的作用,恐惧对应最小的机器人间距离,而愤怒对应最大的机器人间距离,这是预期的结果。由于圆周运动,快乐的旋转速度标准差最高,因此其空间同步性最低,愤怒紧随其后。厌恶的时间同步性最高,因为大多数时间所有机器人一起静止不动。同样,恐惧再次表现为同步性最低的序列。

5.4 结果

我们提出了两个相互关联的数据集:1. 每个序列所传达的情绪识别;2. 感知到的组织的参数对这些序列表现力的影响。

图7 : 混淆矩阵,表示每个表情序列(恐惧、快乐、悲伤、惊讶、厌恶、愤怒)中,认为某一情绪状态是描述该序列的最佳候选的参与者的百分比。例如,33%的参与者认为惊讶是描述设计用于传达恐惧情绪的序列的最佳候选。

参与者对情绪状态的区分程度如何?

参与者填写了一系列李克特量表问题,以评估每个舞蹈序列唤起特定情绪的程度。总体而言,参与者在将他们观看的序列与相应的情绪状态关联时存在困难。快乐、惊讶和恐惧量表得分相对最高,但在七点量表上的平均分仅为约2分。尽管这些序列未能引发明显的情绪反应,参与者对它们的回应仍各不相同。这一点可以从图7所示的classification分布中观察到。对于每个序列及每位参与者,我们从李克特量表评分中提取了最佳候选(即得分最高的情绪,包括并列情况)。恐惧和快乐是两个最成功的的情绪,因为它们更频繁地与其对应的序列(编舞者意图传达该特定情绪的序列)相关联。我们进行了肯德尔W检验,以评估参与者在每个序列各情绪排序上的一致程度。协调系数见表6。除“厌恶”序列外,其余每个序列均显示出显著的一致性。

该矩阵还揭示了潜在的误分类情况:某些序列被优先归因于并未打算传达的那些情绪。如果我们具体观察 “恐惧”和“快乐”这两个序列,可以发现它们往往与它们对应的情绪以及“惊讶”情绪产生同等程度的关联。针对每种情绪状态的等级得分进行的威尔科克森符号秩检验确实证实,对于“恐惧”序列而言,恐惧与惊讶之间的比较不具有显著性(z= 1.023,ρ= 0.306),而其他所有比较均具有显著性。同样,对于“快乐”序列,快乐与惊讶之间的比较也不具有显著性(z=1.157, ρ= 0.247),而其他所有比较均具有显著性。

表6 :六种序列的肯德尔W相关分数。所有序列的df= 5。

表达序列 肯德尔W χ² ρ
fear 0.311 63.777 <0.0005
快乐 0.210 43.096 <0.0005
悲伤 0.127 25.983 <0.0005
惊讶 0.200 40.990 <0.0005
厌恶 0.061 12.525 0.028
愤怒 0.101 20.644 <0.05

感知的组织性参数如何有助于识别情绪状态?

我们验证了不同情绪状态的识别在多大程度上与群体行为中感知组织的参数相关。如表7所示,某些感知组织的参数与特定的情绪状态相关。机器人保持在群体中的倾向更可能与较高的恐惧评分(τb= 0.115, ρ< 0.05)相关。这与编舞者选择表现出机器人高度聚合的行为是一致的,类似于生物群成员通过紧密聚集以防范捕食者的方式。机器人同步它们的运动的倾向更可能与较高的快乐评分(τb= 0.161,ρ< 0.005)相关。我们还发现,快乐特别与机器人形成图形的倾向相关(τb= 0.216, ρ< 0.0005)。结合来看,同步性和图形这两个参数似乎是编舞者选择表达快乐情绪的特定序列中的关键因素。机器人被表现为参与一种圆圈舞,在虚拟图形的轨迹上运动,并且机器人之间的运动具有高度的相互依赖性。机器人跟随同伴之一的倾向与大多数情绪状态相关,但快乐和愤怒除外。事实上,恐惧、惊讶、悲伤和厌恶的序列都在某种程度上使用了顺序变换的元素:一种动态状态(例如机器人聚集在桌子的左下角),接着是另一个状态,并通过一个过渡阶段,其中一个机器人被视为引领方向。那些与领导性参数无显著关联的情绪状态,则缺乏这种顺序性特征,例如机器人在整个序列中随机分散于桌面(愤怒),或始终停留在同一区域(快乐)。

表7 : 六种序列的相关系数 (τb)。

Fear 惊讶 快乐 悲伤 厌恶 愤怒
倾向于保持群体状态 0.115 0.030 0.041 0.029 0.012 -0.032
倾向于同步 -0.34 0.005 0.161 0.005 0.065 -0.017
倾向于跟随其中一员 0.220 0.107 0.029 0.191 0.123 0.103
倾向于形成图形 -0.038 0.016 0.216 0.073 0.053 0.000

5.5 讨论

Buzz编程语言及其虚拟机被证明是设计表达性序列的多功能工具。由于简化了设计参数,编舞者能够在目标情绪状态与控制算法之间建立映射,而无需具备去中心化编程的专业知识。每种可用的控制算法最终都与一种独特的目标情绪状态相关联,例如恐惧与“聚合”相关联,而愤怒则唯一地与“随机部署”算法相关联。

然而,情绪与控制算法之间的这种映射并未转化为对情绪状态的唯一识别模式:总体而言,参与者难以识别编舞者意图表达的情绪,尽管他们仍能对这些情绪做出差异化的反应。其中,恐惧和快乐更常与相应的序列相关联,而悲伤或厌恶等其他情绪则被证明尤其难以通过集体运动来表现。难以确定恐惧和快乐之所以更成功,是因为它们可以通过适合群体表达的抽象模式[58]来传达,而其他情绪则更紧密地关联于面部、手势和姿势构型(例如,厌恶时的防御性姿态)。我们研究中观察到的一些知觉混淆现象,与巴拉科娃和劳伦斯[59]在使用拉班舞谱描述机器人运动时指出的问题相似:在“恐惧”、“愤怒”和“快乐”的编码之间出现了重叠。此外,为了更好地表现情绪,可能缺乏的是对已知可唤起特定情绪的运动特性的精细控制(例如,愤怒对应急动的动作;快乐对应大幅度且快速的动作[28, 60])。误分类现象,特别是恐惧与惊讶之间以及快乐与惊讶之间的混淆,也可能源于控制参数在精细调节运动参数方面的局限性。此外,我们可以推测,恐惧与惊讶的混淆是由于序列某些时刻群体发生了突然重组,意味着对外部变化的快速调整;而快乐与惊讶则可能因频繁的构型变化带来高唤醒度的印象而被混淆。

研究集体表达的一个有趣要素是编舞者在设计表达序列时所依赖的多样化直觉。根据我们观察到的感知到的组织参数的变化,至少可以区分出四种表达特征:集体行为、图像元素、叙事元素以及相互依赖性的变化。为了描绘情绪,编舞者可以借鉴在集体行为中观察到的一系列表现方式动物群体。鸟群或鱼群表现出的自组织行为[61]可能为机器人集群的集体表达提供灵感。在我们的实验中,编舞者在将集群动画表现为一群逃离捕食者的羊时,似乎基于动物行为来设计与恐惧相关的运动。在某些序列中,涉及了图像元素,即机器人采用某种构型,对人类观察者而言可能暗示某种几何图形。这种元素出现在表现快乐的序列中。在此序列中,编舞者描绘了一个圆形,从而利用了圆润这一特征,而该特征常与积极情绪的表达相关联[58, 62]。在其他一些序列中,例如恐惧和厌恶,编舞者采用叙事方法进行设计,描绘了一系列事件。通过群体构型的连续变化以及追逐序列(其中一个机器人看似引领方向),用以传达态度和情绪。这些序列呼应了众多关于生动性感知实验研究中所使用的序列 [63, 64],,表明这些描绘出的运动模式对应于基本表达模式。最后,编舞者利用机器人之间相互依赖关系的变化来表现特定的情绪状态。观察者将快乐与高度的同步性联系在一起,这体现了动态关系的表达潜力。在此序列中,机器人参与了一种高度动态的位置调整游戏,能够传递一种欢快喜悦的态度。这些微妙的模式在设计表达性集体运动时构成了值得深入挖掘的有趣元素。

6 结论

在本研究中,我们解决了表征群体内部状态的挑战。我们设计了两组用户研究,每组研究都加深了我们对运动参数的理解。为了开展这些研究,需要一个灵活的实现方案,因此我们提出了我们的去中心化软件基础设施。基于一个群体特定编程语言,我们实现了一系列通用群控算法,供运动设计者独立于底层硬件进行选择和调整。每种算法都有特定的参数,这会迅速增加对其影响进行分析的复杂性。为了缩小分析范围,我们提出了三个高层级运动属性:时间同步性、空间同步性和机器人间距离。

第一次实验将机器人组的表现力和凝聚性与群集行为的高层控制属性(作为控制参数注入)相关联。结果表明,群体的感知到的凝聚力随着机器人保持在群体中的倾向(有组织性)及其空间同步性而增加。群体的表现在力也因机器人保持群组的倾向而增强,但受到时间同步性的负面影响。

第二次实验要求一小群专业编舞者设计六个表现性运动序列,以展示内在情绪状态。结果表明,在所有在线参与者中,有一半的序列被赋予了情绪,且在情绪识别上达成了显著的一致:恐惧、快乐和惊讶。恐惧和快乐与高同步性相关,而快乐还与形成图形的倾向相关。我们还观察到,愤怒与群体中缺乏领导性显著相关。

利用这些结果,可以调整群体运动以向其操作员传递高层信息。例如,在执行探索任务时,部署的群体部分在检测到气体泄漏时可以同步聚集,以告知其操作员危险情况。从更广泛的角度来看,我们相信这些初步结果是迈向更好理解人工群体感知的垫脚石,旨在改善人类与群体在协作任务中的非语言交流。

下一步包括理解与群体动态状态变化相关的表现性图形的发展,以及理解这些表现性图形与群体是否被感知为友好、冷漠或具有威胁性的存在之间的关系。最后,我们的下一个实验将把表现性运动的设计融入面向任务的交互场景中,以探索如何最好地利用这些发现。

您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值