机器人学中的因果认知分类

因果关系在机器人学中的重要性:综述、分类与分析

摘要

本文探讨了因果推理在机器人学研究中的作用。受人类因果认知分类的启发,我们提出了机器人因果认知的分类方法。针对每个类别,我们识别了机器人学领域相关的早期研究工作,并关联到其他科学领域的研究成果。尽管所提出的分类主要涵盖机器人学的感知–规划–行动层面,我们还识别出若干高层级的研究方面,在这些方面中因果关系也发挥着重要作用,例如可理解性、机器伦理和机器人学研究方法。总体而言,我们得出结论:因果关系构成了机器人学中多个问题表述的基础,但在已发表的研究中却出人意料地缺失,尤其是在明确提及和使用因果概念与术语方面。我们讨论了这种现象的原因及其后果,希望本文能阐明因果推理与机器人学之间广泛而深刻的联系,并指出其与其他研究领域的紧密关联。从长远来看,这也有望推动机器人学领域的“因果革命”。

关键词 :机器人学,因果认知,因果推理,因果推断,因果关系,因果性,反事实推想,智能

1 引言

因果推理通常被认为是人类完成预测、诊断、分类、行动规划、决策-制定和解决问题等任务所必需的关键认知能力[1]。因果理解的发展被描述为人类进化的一个重要部分[2,3],而因果功能也偶尔被认为是智能机器人发展所必需的[4]。

本文的目的是提供一个结构化的分析,探讨因果性这一广泛领域如何与同样广泛的机器人学领域相关联。受人类因果认知分类的启发-人类因果认知[5],我们提出了机器人因果认知的一种分类-。我们还指出了机器人学研究中因果关系正在或可能发挥重要作用的若干其他方面。我们回顾了机器人学中相关的早期工作,并确定了与其他科学领域中关于因果关系的早期研究之间的联系。

总体而言,我们发现机器人学领域早期很少有明确提及因果关系的研究工作。然而,我们识别出机器人学的几个主要子领域与因果概念之间存在一些有趣的联系。例如,任务规划和几种常见的学习范式都依赖于通常隐含的因果假设和原则。

本文其余部分组织如下:第2章节概述了因果关系在其他科学领域中的处理方式。在第3章节中,我们分析了因果推理在机器人学中的作用及其与早期工作的联系。第4章节-最后讨论了因果关系在已发表的机器人研究中相对薄弱的原因及其影响。

不同研究领域之间甚至同一领域内的作者之间,基本术语常常有所不同。在本文中,我们交替使用因果推理和因果认知(心理学中常用[1,5,6])这两个术语,来表示以下两个过程的结合:(a)学习因果关系模型,以及(b)使用因果模型并从中得出结论。过程(a)在此称为因果学习,过程(b)称为因果推断(在计算机科学和统计学中,后一术语通常用来表示(a)和(b)的结合[7–9])。

本文提出的工作适用于各种机器人,但特别适用于与人类、其他机器人或环境密切交互的机器人。

2 机器人学之外的因果关系

因果关系长期以来一直是多个科学领域的活跃话题,我们将在本章节总结哲学、统计学、计算机科学、认知心理学以及机器学习等领域如何处理和已经处理因果关系。每个领域都产生了大量的研究成果,因此我们的总结具有高度选择性——重点关注与机器人学相关的因果关系概念和观点。

2.1 哲学

因果关系是这样一个概念,尽管经过数千年的大量智力探索,它仍然持续让我们感到困惑。学者们之间的观点仍存在广泛分歧,甚至对于因果关系是否存在都未达成一致,更不用说它究竟是什么了。然而,人们在日常生活中频繁使用因果表达,并对其含义有着相对一致的理解。大多数人也相当清楚因果关系与相关性之间的区别,即使他们不一定使用这些术语。举个例子,假设一位冰淇淋店店主在一个炎热的夏季月份观察到电力消耗与冰淇淋销量之间的关系。结果发现,在电力消耗高的日子里,销量也会上升,反之亦然。这是否意味着店主应该打开店里所有的灯以提高销量?我们大多数人可能都会认为这是个糟糕的想法,而冰淇淋销量与电力消耗之间所观察到的相关性,其真正原因是第三个变量——室外温度。高温天气既促使人们购买更多冰淇淋,同时也增加了电力消耗,因为空调在炎热的日子里需要更努力地工作。

毫不奇怪,哲学家们并未满足于这种关于因果关系的直觉性概念。在本章节的其余部分,我们将仅仅浅要探讨有关因果关系本质的大量研究工作,重点关注那些与后续分析和讨论相关的哲学理论。

伍德沃德[10] identifiestwo main kinds of philoso-phicalviews on what causation is. The difference-makingviews focus on how causes affect whathappens in theworld, suchthat the state of the world differs dependingon whether the cause occurs or not. For example, a robotvacuum cleaner startingup in the middle of the nightmight be regarded as thecause of theowner waking up. The other kind of views are denoted as thegeometrical-力学理论并关注这样一种观点:原因与结果以某种方式相互关联,通常是通过从原因到结果传递某种“力”。一个典型的例子是台球撞击另一个球,从而停止运动,而另一个球则由于“能量”或动量的传递开始运动。

与关于因果关系的大多数理论一样,这两种观点都很容易找到有力的反例。通过引用运动相对性的基本物理原理,可以轻易质疑台球例子。-一个球朝第二个球运动,等同于第二个球朝第一个球运动,但根据几何‐力学观点,在这两种情况下会被指定为原因的球是不同的。一个挑战差异制造观的经典例子是fi行刑队,其中十名士兵射击一名受害者,导致其死亡。然而,对于每个士兵来说,都可以说他或她并未造成死亡,因为即使该士兵没有开枪,结果也是一样的。每个个体士兵都没有产生差异-。另一方面,有许多事件确实产生了差异,但却通常不被视为原因。大爆炸certainlymadeseveral differences,但它通常不会被称作如今发生事件的原因,尽管这些事件发生在数十亿年之后。另一个较新的例子见参考文献[11,第 127],页,其中指出拥有肝脏是患上肝硬化的必要条件,尽管不是充分条件。因此,拥有肝脏是是否患上该疾病的一个差异制造者,即使说拥有肝脏导致了该疾病并不合理。

这种关于必要和充分条件的推理方法由麦基[12,13],进一步完善,他认为,当我们说某事物是原因时,通常意味着它是“一个本身不必要但对结果而言充分的条件中的不充分但非冗余的部分”。这样的条件被称为INUS条件。举个例子,考虑一座房屋因内部发生短路且附近存在易燃材料而引发火灾的情况。短路被认为是火灾的原因,因为:(a)它是真实条件“短路和易燃材料的存在”的一部分;(b)短路是该条件中不充分的(因为还需要易燃材料),但却是必要的(即非冗余的)(因为该条件是一个合取式)部分;(c)该条件本身是不必要的,因为它可以被其他条件替代(例如,“雷击和易燃材料的存在”);(d)该条件是充分的,因为它自身就足以导致房屋起火。

大卫·刘易斯基于反事实依赖[14]提出了一种相关的因果关系理论。一个效应是被称为在反事实推想上依赖于一个原因;即如果该原因没有发生,那么结果也就不会发生。此外,当存在一条将A与B连接起来的因果链形式的反事实依赖时,A就被认为是B的原因。反事实推理这一概念变得既流行又有影响力(尽管当然麦基和刘易斯的理论都受到了反例的挑战)。

人们可以从几位著名科学家的情绪化言论中感受到一种未能定义“因果关系”的—因果关系”所带来的某种挫败感。深度参与这一辩论的伯特兰·罗素在1913年总结道:““因果关系定律,⋯⋯是过时的遗物,如同君主制一样,仅仅因为人们错误地认为它无害而得以延续。”[15].1

接下来,我们将探讨因果关系在统计学和计算机科学中过去及现在的处理方式。

2.2 统计学和计算机科学

我们首先总结统计学与因果关系之间的关系:仅凭概率无法区分原因和结果。这一事实很早就被统计学家意识到,但却带来了不幸的后果。数理统计学奠基人之一、英国数学家卡尔·皮尔逊在其著作1911[17],中完全摒弃了因果关系,“称其为现代科学不可理解的奥秘中的一个迷信。”然而,正如朱迪亚·珀尔所指出的[18,第 412],页所述,统计学甚至无法表达诸如“泥巴不会导致下雨”这样简单的陈述。不过,已有若干尝试试图用概率术语来表述因果关系。根据前文提到的将因果视为差异制造者的观点,原因C可被视为能够提高事件E发生概率的因素。最简单的情形可以表示为

$$ P(E \mid C) > P(E) $$ (1)

虽然这乍一看似乎是因果关系的一个有希望的定义,但它存在若干问题。首先,它在某种意义上是对称的,即方程[19](1)与之等价

$$ P(C \mid E) > P(C) $$ (2)

因此,如果C是E的原因,那么E也是C的原因,这与大多数关于因果关系的直觉和形式概念相违背。其次,它无法区分真实因果关系和虚假相关。回到之前提到的冰淇淋例子,根据公式-,用电量将被视为导致销量增长的原因,其中概率由观测数据估计得出。这种错误推断的形式化原因是存在一个“(1)”“混杂变量”,即户外温度,它是电力消耗和销售量的-共同原因或混杂变量。

已尝试通过对待背景变量进行条件化来修复该定义:

$$ P(E \mid C, K) > P(E \mid K) $$ (3)

对于冰淇淋案例,让K表示室外温度可以避免得出“电力消耗(C)导致销售量升高(E)”这一错误结论。例如,当K为25°C(或其他任何固定值)时,方程(3)可能不再成立。然而,要普遍回答哪些变量应包含在K中却远非易事。南希·卡特赖特提出,K应包含所有“因果相关因素”,这可能是正确的,但遗憾的是,并未提供确定这些因素的方法。更新近的方法在参考文献[22]中被提出并讨论。

一种简单而直观的方法来检验电力消耗是否真的导致销售额上升,就是在现实中进行试验:在某些日子里打开商店中的所有灯具和电器设备,并观察销售情况如何受到影响。为了确保结果的可靠性,当然应在多个随机的时间点重复这一过程。这种方法已被形式化为随机对照试验(RCT)技术,该技术由罗纳德·费希尔在1925[23]中推广。自那以后,随机对照试验一直是发现和检验因果关系的标准工具。其中关键的词语“随机-化”指的是干预,即我们在某些日子里故意增加电力消耗。

如果这种干预是随机进行的,那么背景变量K的取值将在被干预和未被干预的情况下均匀分布,即使我们并不知道这些变量K具体是什么(有关随机对照试验在机器人学中作用的讨论,请参见第3.3.4节)。需要注意的是,随机对照试验是在总体层面估计因果性,并计算平均因果效应,也称为平均治疗效应。这可能对个体层面的因果性说明甚少。例如,考虑一种药物使所有男性健康状况改善,但使所有女性病情恶化。在一个包含数量相等的男性和女性的随机对照试验中,平均治疗效应将被估计为零,即使该药物对实验中的每个人都产生了因果影响。

因果推断的两大主要框架之一是内曼‐鲁宾因果模型[25,26],其中二元变量C的因果效应被定义为C发生时的潜在结果与C未发生时的潜在结果之间的差异。然而,对于特定实例,只能观察到一种潜在结果,具体取决于C是否发生。这个我们无法观测反事实的一般性问题被称为因果推断的根本问题[27, p. 947]。第二个主要框架由珀尔通过do‐演算[28]推广开来(简要介绍参见例如参考文献[29])。使用这一形式体系,当满足[30]时,我们说C导致E。

$$ P(E \mid do(C)) > P(E) $$ (4)

do‐算子封装了干预的概念,而$P(E \mid C)$描述了当观察到E取某个特定C值时的情况,$P(E \mid do(C))$则描述了如果将E设为某个特定值时,C会取什么值。引入do‐算子的“巧妙之处”在于,通过一种公理化方法绕开了关于因果关系“本质”的整个讨论,这与欧几里得几何、数论和概率论中的处理方式类似。

多个变量之间的因果关系可以用因果贝叶斯网络来方便地表示,它是一种有向无环图(DAG),其中节点代表变量,有向连接(即箭头)表示从父节点到子节点的因果依赖。因此,一个父节点会“导致”其子节点取特定值。每个节点都有一个与其父节点相关的条件概率表。给定一个DAG后,利用do-演算可以推断出关于DAG中变量之间因果关系的因果问题的答案。DAG可以通过多种方式构建。进行随机对照试验是一种选择,但通常成本高、耗时长,有时甚至不可行。然而,图结构也可以通过从观测数据中进行因果发现[7, pp. 142–154],[31],来学习,例如使用LiNGAM[32]算法以及PC和FCI算法[33],或从a基于问题领域的先验知识构建形式化的结构因果模型[29]。需要注意的是,仅从观测数据中无法学习有向无环图中因果关系的方向,必须结合额外的领域信息或假设。例如,LiNGAM算法基于不存在未观测混杂变量的假设。

为了便于实际应用,一些研究人员和公司提供了用于统计因果学习与推断的算法实现。微软推出了软件库DoWhy,为多种因果推断方法提供了编程接口(https://github.com/Microsoft/dowhy)。因果发现中心提供了多种工具,包括Tetrad因果发现工具(https://www.ccd.pitt.edu/tools/)。埃利亚斯·巴雷因博伊姆提供了Fusion,这是一种基于珀尔著作[30]的工具(http://bit.ly/36qUz4y)。CausalWorld是一个在模拟机器人操作环境中用于因果结构和迁移学习的基准测试平台[34](https://sites.google.com/view/causal‐world)。其他软件包的链接可参见参考文献[31],,当然也不断有新的软件被开发出来。

2.3 认知心理学

因果推理在认知心理学研究中,直到大约三十年前都尚未出现。其中一个原因可能是哲学和统计学对因果关系普遍持怀疑态度(见章节2.1),导致早期心理学的研究大多基于相关性和关联。这一现象的原因至少可追溯至18世纪休谟的工作’s(关于其影响的分析,参见例如参考文献[35])。

因果性进入认知心理学研究的一个例子是-因果感知,即对某些观察到的事件序列立即产生因果关系的感知。这种效应会自动出现,且通常难以抗拒。例如,当你关闭房屋中的门时,如果灯恰好在此时熄灭,你可能会感知到是你导致了灯熄灭,即使你知道这完全不正确。然而,在许多情况下,对因果关系的感知是正确且有价值的,并且已经在6-个月大的婴儿中观察到-婴儿-。[36, 第 4]页

一种对人类因果推理具有历史影响力的模型是–Wagner模型[37],,该模型基于观察结果逐步估计条件刺激与非条件刺激之间的关联。这类关联模型及其类似模型长期以来相当在模拟人类行为方面取得了成功,但研究也表明,仅用共变信息有时无法解释人类的因果推理[1]。迈向因果理论的一步是概率论等理论,例如PΔ模型[38,39],,旨在模拟人类如何学习潜在原因C与结果E之间的强度关系。因果强度PΔ由以下公式给出

$$ PΔ = P(E \mid C) - P(E \mid ¬C) $$ (5)

其中概率可以通过观测到的频率数据来估计。该PΔ模型遵循前文所述的原因作为差异制造者的哲学观点(参见章节2.1)。它可以被视为方程(1)的变体,因此同样存在对称性和共同原因的缺陷。

为了阐明相关性与因果关系之间的区别:方程(5)量化了变量E和C之间的相关性E和C可能存在很强的因果联系,但这一点无法从PΔ中得出。原因是E和C可能有一个共同原因这一第三变量,这可能导致两者表现出强相关性,并产生较大的E和CPΔ。以2.1节给出的例子为例,冰淇淋消费量和用电量之间可能会有较大的PΔ,尽管这两个变量之间并不存在因果关系。

该功率PC理论[39]基于PΔ模型,旨在利用协变数据并结合背景知识来建模因果的力。一些研究表明,该模型符合人类因果推理的某些方面。然而,无论是PΔ模型还是功率PC理论,都被认为不足以充分解释人类的因果推理[40]。

用于因果推断的机器学习算法-方法(参见第2.2节)[41–43]也已被视为人类因果推理的模型。若干实验表明,人们以与因果贝叶斯网络相同的方式区分观察和干预-(参见第2.2节)(参见第2.2节)。一个普遍关注的问题是,这些算法需要大量训练数据,而人类通常仅凭少数几次观察就能学习到因果关系。当变量数量较多时,人类无法估计所有必要的协变关系,实验也表明,除了协变数据外,人类还会利用机制知识-来得出因果结论。研究还表明,人们会利用关于不同机制时间延迟的先验知识不同机制的时间延迟信息[44]。例如,如果我突然感到恶心,我可能会认为原因是两小时前服用的药物,而不是一分钟前吃的食物(引自参考文献[1]),从而减少需要考虑的协变关系数量。人们还会使用诸如例如空间邻近性(假设结果与其原因在空间上接近)、时间顺序(假设原因不能先于其结果发生)[45],以及其他时间线索[46,47]。Waldmann[1,35]认为,人类采用的是这种所谓的基于知识的因果归纳,而非基于统计推断的贝叶斯方法。加登福斯[48]支持这一观点,并进一步指出,人类因果认知是基于对事件中涉及的力的理解,同时还为在机器人中实现此类因果推理提供了指导原则。

2.3.1 人类因果认知的分类

隆巴德和加登福斯[5,49]提出了人类因果认知演化的七个等级模型。这些等级构成了一个日益复杂的因果技能层级:

  1. 个体因果理解与追踪行为 。理解感知到的运动动作与其感知到的结果效应之间的联系。示例:婴儿学会踢腿会导致脚以某种方式移动。
  2. 提示性二元因果理解 。理解另一个人类的行为感知与其所产生的效应之间的联系。
  3. 同种心智解读 。理解另一个人类的欲望、意图和信念如何导致不同种类的行为。示例:如果一个人去取一杯水,我推断此人渴了。
  4. 脱离式二元因果理解 。理解另一个人类的行为(未被直接感知)与其效应(被感知)之间的联系。示例:你在雪地中看到人的足迹,并推断过去有人存在是这些足迹的原因。
  5. 非同种个体的因果理解与心智解读 。示例:如果我看到一只动物,甚至动物的足迹,我可能能够推断该动物的心理状态。
  6. 无生命因果理解 。理解无生命物体之间的因果关系。示例(来自参考文献[49]):通过观察苹果从树上掉落的同时刮起一阵风,我推断是风导致了苹果掉落。
  7. 因果网络理解 。理解一个因果网络中的节点如何与另一领域中因果网络的节点相连接。示例(来自参考文献[49]):一旦我了解到风可以导致苹果掉落,我就可能理解风也能导致其他物体掉落或移动。

虽然这七个等级被提出作为人类进化的模型,但我们fi也发现它们对于描述具有偶然认知的机器人““进化””同样有价值,并将在第3.1节中基于此进行构建。

2.4 机器学习中的因果关系

在机器学习领域,近年来深度学习的进展是在没有任何明确因果概念的情况下取得的。正如哈利维、诺维格和佩雷拉在他们2009年的文章《数据的不合理有效性》中所提出的那样,语音识别[50],、自然语言翻译以及图像处理[51]等应用成果可被视为数据对模型的胜利。一种普遍的看法似乎是,并且在很大程度上至今仍然是:只要向足够强大的计算机运行的足够大的神经网络提供充足的数据,大多数问题就能得到解决。一个极端的例子是,目前最先进的语言处理模型GPT‐3[53],,使用了近5000亿个词元进行训练,并包含1750亿个参数。鉴于模型的规模与所建模的数据量级相当,将其类比为巨型查找表并不牵强。然而,在GPT‐3推出时,它在包括翻译、问答以及新闻文章生成在内的众多自然语言处理任务上均超过了此前最先进的水平。

尽管这种纯粹的数据驱动方法取得了毋庸置疑的成功,但一些批评声音对其真正的“智能”表示担忧。人工智能与因果推理领域的先驱之一朱迪亚·珀尔认为,深度学习仍停留在关联层面,本质上只是进行高级的曲线拟合[8,54]和聚类,仅对数据中的相关性进行建模。因此,它适用于预测,能够回答诸如“选举结果会是什么?”之类的问题。然而,它无法回答因果问题,例如“如果我们采取不同的财政政策,是否会获胜?”或“我们如何才能让更多人投票支持我们?”前一个问题需要对已经发生的事件可能存在的替代情况进行反事实推想,而后一个问题的答案则提供了一种控制性的行动,例如“通过降低利率”。而反事实推想和控制能力对于仅使用观测数据的方法而言是无法实现的。

在机器学习中对预测算法的依赖,加上机器学习在真实世界任务中的使用急剧增加,由于这些原因,被视为一个严重问题[55]。

深度学习领域的领先研究者莱昂·博图指出了机器学习的一个根本问题“不顾后果地吸收训练数据中发现的所有相关性-中的相关性”[56]。这导致模型对源自数据偏见的虚假相关性敏感-性,并且无法识别因果关系,例如图像中特征与物体分类之间的因果关系。4此类失败的示例以及关于在类人智能模型中普遍需要纳入因果关系的论证,可在参考文献[4]中找到。对因果性与泛化之间特定联系的分析见参考文献[58]。

在机器学习(参见参考文献[7,59]以了解概述)以及深度学习(特别是[4,60–63])中,融入因果推断与因果推理的重要步骤也已取得进展。接下来将更详细地介绍两种用于监督学习的具体技术。不变风险最小化(IRM)范式[56]旨在解决机器学习中“分布外”泛化所出现的问题。为了训练能够在之前未见过的数据上同样有效工作的神经网络,首先将训练数据划分为多个环境。损失函数被扩展,加入了一项用于惩罚不同环境之间性能差异的项。这有助于促进网络在各个环境间的不变性,而这种不变性从根本上与因果关系相关联。不变因果预测(ICP)方法[64]是一种识别与目标变量具有因果关联特征的技术(而非仅通过相关性连接)。该方法利用特征组合,为来自多个不同环境的数据建立独立模型。那些在所有环境中均表现良好的特征组合,很可能包含导致目标变量的特征。若干此类成功组合的交集被视为整体的因果相关特征。

3 机器人中的因果关系

在本章节中,我们对因果推理在机器人学中的作用进行了分析,该分析分为两部分。first部分提出了一种新颖的机器人因果认知分类,该分类受到参考文献中人类因果认知分类的启发,此前已在第2.3.1节中描述。后一部分描述了七个等级的因果技能层级,其中人类掌握了所有等级,而动物[5],则等级较低仅特定等级,均根据其在进化中的阶段而定。我们的分类定义了与这些等级相关的八个类别;然而,如第3.2节所述,存在若干重要差异。这些类别主要在感知–规划–行动层面描述因果认知。分析的第二部分描述了机器人学中因果关系的使用,超越了第一部分所涵盖的感知–规划–行动层面。

在本章节中,我们回顾了机器人学领域的相关早期研究,同时指出了之前所述的哲学、统计学、计算机科学和认知心理学领域工作之间的联系。

3.1 感知‐规划‐行动中的因果关系

我们的分类包括在感知‐规划‐行动层面的机器人因果认知的八个类别。其底层的因果机制如图1所示,图中包含一个机器人、一个人类以及(其余的)世界,它们通过箭头表示的因果关系相互影响,数字对应相应的类别。这些类别在图2中有更详细的说明。我们包含了互动的人类内部的因果过程,因为这对机器人的因果推理至关重要。

最上面一行显示了人类思维发起(即引起)运动力量(例如肌肉激活),从而导致运动行为(例如肢体运动)。由于人类处于环境中,运动行为反过来可能导致世界效应。机器人的思维也以类似方式建模,并额外添加了世界效应以模拟非生命体之间的因果关系。对于人类和机器人而言,“心智”一词指的是以某种原因引发运动力量的机制。在确定性世界中,这种机制的激活当然也有其原因。“心智”一词带有自由意志和非决定论的关联,表明我们将心智视为“最终原因”。

在图中,所有因果关系均用粗箭头表示。原因推断用指向被推断实体的细箭头表示。

类别1–3涉及因果学习,即机器人如何学习涉及自身、互动的人类以及世界的因果关系。类别4–6涉及与互动的人类相关的因果推断的重要情况。类别7–8涉及机器人如何决定如何行动,以及在不同程度上对因果推理的复杂运用。

类别1. 感觉运动学习

这种因果技能涉及学习从运动力量到运动行为的映射(图2)。前者由机器人的-心智激活,作为某些决策活动的结果,将进一步描述为类别7和8。该因果机制也在图1中通过箭头1进行了说明。

感觉–运动学习与运动牙牙学语密切相关,这被认为是婴儿用来学习肌肉运动与由此引起的身体姿势和肢体位置变化之间映射关系的方法[65]。运动牙牙学语也被认为是人类’获得更复杂行为(例如沿轨迹运动以避开障碍物)的合理模型-viors,例如沿轨迹运动以避开障碍物或指向抓取物体的运动[66]。运动牙牙学语在机器人学中已被较为充分地研究[67–69],目的相同。典型的设置是机器人学习在随机探索的关节设置与来自触觉传感器或视觉传感器的感知输入之间的映射关系。对于具有大量关节的复杂机器人,“维度灾难”需要特殊的解决方案[70]。该映射与“运动学方程”密切相关,后者将关节设置映射到例如机械臂的构型。在参考文献[71],中,一个机器人学习了移动手臂、接触物体以及物体在视觉上移动之间的因果关系。结果表明,因果依赖如何通过区分真实物体与视觉伪影来提升场景理解能力。

从因果的角度来看,运动牙牙学语与强化-学习有关(参见第2.2节),其中机器人部分执行随机行动,并根据这些行动是否导致(即,引起)有利状态-而获得奖励。

类别2. 关于机器人如何影响世界的学习

此类别涉及机器人如何学习其运动行为对世界产生的因果影响。参见图2以及图1中标记为2的箭头。一个例子是通过按下某个按钮来启动计算机的机制,另一个例子是服务机器人通过建议用户读书使其感到愉快。前文所述的RCT技术(见第2.2节和3.3.4节)为此类学习提供了通用方法,类似实验方法也应用于参考文献[72],中,其中Baxter机器人学习了工具的功能属性(工具可用于什么用途)。机器人首先观察了人类教师使用锄具推动方块的演示。随后,利用前述用于因果学习的PC算法(第2.2节)构建了一个初始的结构因果模型,形式为有向无环图[18]。为了确定有向无环图中边的方向,机器人通过强制某个变量取新值并观察结果来进行干预。然后通过非参数检验估计两次干预分布之间的差异。通过进一步的干预,机器人将自身的行为作为节点添加到有向无环图中。

类别3. 学习关于因果世界

此类别涉及机器人如何通过因果机制学习世界的变化。一个例子正在学习引力和惯性等物理定律。该类别还包括无生命物体和人类如何影响自身、相互影响以及影响机器人。一个例子是机器人伴侣学习到路上的冰有时会导致人类滑倒。另一个例子是机器人学习到用户在深夜看完电视后tendstoforgetchargingit。

在图2中,此类别由两个世界效应项目之间的箭头表示,在图1中则由标记为3的箭头表示。人类通常通过观察事件的同时发生并计算诸如因果力PΔ不等式(5)之类的度量来发现此类因果关系。然而,机器人当然也可以这样做,但同样存在将相关性误认为因果关系的风险。

一种实验性方法可以解决这一风险,参见文献[73,74],,其中作者描述了一个iCub类人机器人,该机器人学习与阿基米德原理相关的简单因果关系。-例如,机器人学习到物体排开的水量与其颜色无关。这种认知是通过实验对因果关系进行累积学习而获得的。基于自身经验,机器人选择其认为能够引起期望反应的行动,并逐步更新其因果假设。

与第2.2节中描述的统计因果推断技术密切相关。任何真实-世界的应用都必须处理超越单一原因产生单一效应的复杂因果关系。在现实世界中,原因通常既不充分也不必要,而这种交织的关系最好用因果贝叶斯网络等技术来表达。如前所述,已经开发出多种算法和软件工具,用于构建此类网络并进行因果推断。果。在真实世界中,原因通常既不-充分也不必要,而这种复杂的因果关系最适合通过因果贝叶斯网络等技术来表达。如前所述,目前已开发出多种算法和软件工具,可用于构建此类网络并进行因果推断。

类别4. 二元因果理解

此类别涉及如何通过观察另一智能体的运动行为来推断该运动行为的原因。人类借助镜像神经元完成这一任务,镜像神经元是一类特殊的神经元,对所观察到的动作和自身产生的动作均有反应[75]。例如,通过观察另一个人的踢球动作,观察者可能会感知到腿部的非自主运动[76]。镜像神经元还被认为在人类共情中发挥作用[77]。例如,如果踢球者在击球后皱眉,观察者也可能“感受”到疼痛。对于人类而言,其中一些机制由先天性镜像神经元机制编码,因此无需学习即可具备[78]。

类别4指的是机器人观察互动的人时所采用的这种因果推断机制。该机制在图2中进行了说明,箭头从观察机器人的眼睛指向人类’的运动力量,这些力量被推断为感知的原因。6虚线箭头表示向机器人’运动力量的镜像。

早期的相关工作包括参考文献[79,80],其中镜像神经元被用于支持模仿学习中的动作理解,以及目标依赖的动作-理解-依赖-动作-理解[81]。

类别5. 心智解读

大量机器人学研究致力于解决机器人如何解读互动的人类心智的部分内容。“心智解读”、“心理理论”、“心智化”和“换位思考”这些术语常被用来表示这一过程[82,83]。常见的关注点包括人类正在进行的和计划中的行动与目标,以及人类行为背后的潜在原因。在计划识别、意图识别和行为识别中,通过人类的行动来推断支配其行为的计划、意图或行为。机器人可以以多种方式利用此类知识,例如支持人类或改善协作。示例:养老机构中的一个机器人观察到一个人从冰箱中取出一瓶果汁,由此推断此人感到口渴并打算饮用。因此,机器人建议此人先检测血糖水平。需要注意的是,这种推断容易受到混杂变量的影响(见第2.2节)。从冰箱中取出果汁并不一定是因为口渴,其他可能的原因还包括为他人提供果汁、丢弃过期的果汁或清洁冰箱。因此,仅基于相关性的技术是不够的,可能需要结合上下文才能做出正确的推断[84]。

这类推断在类别5中进行了讨论,并在图2中进行了说明,其中机器人’的眼睛观察人类的运动行为’。基于这些观察,推断人类的计划、意图或行为是可能的原因。

对人类心智的推断’通常基于这样一个理性假设:即所观察的人类其行为是由计划、意图或行为所引起的。在已发表的研究中,这种与因果关系的关联很少被提及。

一个例外是参考文献[85],其中将意图识别与计划适应相结合,用于协作的人类–机器人团队。通过因果链分析来缩小人类可能的选择范围,从而提升意图识别以及机器人行动的适应性。-中-的–

心智解读对于人类操作员教授机器人技能的多种技术都具有重要意义。最常见的此类技术是演示学习(LfD)[87,88]和模仿学习(IL)[89]。在LfD中,人类操作员通常通过远程控制操作机器人,而机器人则试图推断操作员的意图。在IL中,人类执行任务,机器人观察人类行为,并尝试推断其意图。在这两种情况下,目标都是使机器人能够在新情境下重复所演示的行为,即使这些情境的条件与学习阶段不同。通常假设人类是理性的,即每个行动都是因为它会导致某种期望的效果。这意味着LfD和IL从定义上来说都是因果性的。7然而,这并不意味着实际使用了因果推断技术,也不意味着在关于LfD和IL的已发表研究中提到了因果关系。相反,大多数已发表的研究依赖于动作序列与目标、意图或行为之间的观察到的相关性。一些重要的例外情况将在下文简要回顾。flyreviewedbelow。

在参考文献[90,91],中,使用模仿学习(LfD)来教导机械臂跟随由人类教师示范的轨迹。为了实现泛化,采用因果推理来识别所示范的轨迹属于三种预定义用户类型中的哪一种-定义的用户类型(在运动中的谨慎程度上有所不同)。参考文献[92]的研究人员在一个多模态环境中解决了类似的问题。通过将RGB图像、声音频谱和关节角度作为深度神经网络的输入,机器人可以学习跨模态的因果依赖关系-。尽管文章提出了这一主张,但尚不清楚相关性与因果关系是如何被区分开来的。

在参考文献[93,94],中,因果推理被明确用于逆向学习。帕森尼尔斯覆盖理论(Parsimonious Covering Theory,PCT)是一种形式化的因果推理计算模型,被扩展并用于以因果方式推断解释示范行动的人类意图序列。这应与字面模仿所观察到的行动进行对比,后者通常是逆向学习中采取的方法。另一种将环境的因果建模与逆向学习相结合的方法见参考文献[95]。

在参考文献[96],中,作者描述了一种方法,用于理解演示任务的因果结构,以确定哪些变量导致其他变量发生变化。使用机器人模拟器生成了一个演示抓取放置任务的数据,并利用Tetrad这一著名的因果分析计算机程序[97]来识别演示任务中的无关变量。

参考文献[98]的作者以一个例子说明,如何利用逆向学习教自动驾驶汽车根据车内摄像头拍摄的图像来判断何时刹车。其思路是,当行人在图像中的特定位置出现时,机器人应学会刹车,而用于学习的数据则是通过人类驾驶员操作刹车收集的。
但用于学习的数据则是通过人类驾驶员操作刹车收集的。然而,如果汽车的刹车指示灯在图像中可见,则可能会导致严重错误。在这种情况下,学习算法可能会学会在刹车指示灯亮起时启动刹车,这明显是基于相关性的方法混淆了因果关系的典型案例。因果关系可能被基于相关性的方法混淆-。作者将这种错误称为因果误识别,并将其描述为在逆向学习中自然发生的一个根本性问题,也是现实世界中部署的机器学习系统普遍面临的问题。文中提出了两种干预策略来克服因果误识别,一种基于环境奖励,另一种依赖人类专家提供额外输入。

在参考文献[99],中,作者展示了一款机器人,该机器人通过观察几次人类演示后学习到了布料折叠任务。机器人能够复现所学技能,并成功将该任务泛化到其他衣物上。尽管所使用的硬编码图表示因果关系,但其推理机制仅依赖于演示过程中观察到的相关性。

在参考文献[100],中描述了一种室内清洁机器人的设计。为了在四种操作模式(清扫、吸尘、抓取和擦除)之间自动切换,通过使用因果推断技术对观察到的人工决策进行建模,建立从感知到的垃圾属性(例如,大小、固态/液态、平坦/非平坦)到适当操作模式的映射。采用DoWhy工具箱(见第2.2节)构建了一个以有向无环图形式表示的因果贝叶斯网络。

类别6. 脱离式心智阅读

有时机器人只能感知到人类行为的结果,而无法直接感知该行为本身。类别6指的是在这种情况下推断出相应行为的因果技能。示例:机器人看到厨房台面上有一个空果汁瓶,从而推断出人类喝过果汁。

这种推断要求机器人同时处理两种心智表征:当前的感知状态和过去人类的心智[49]。该推断在图2中以与类别5相同的方式进行说明,但此时机器人的’眼睛正在观察世界效应-。ffect。基于此信息,推断出人类的计划、意图或行为作为可能的原因。

推断所感知效应的原因回答了为何观察到该效应的问题。这也可以被视为对该效应的解释的生成。参考文献[101]描述了从观测中推断机器人未执行的-行动(即所谓的外源性动作)的方法。所使用的技术包括KRASP,即基于ASP的机器人知识表示系统,并基于允许表示因果关系的AnswerSetProlog(ASP) 。解释的生成也在第3.3.1节中被描述为可理解的机器人的一部分。

类别7. 规划

通过规划,我们在这里指的是机器人生成单个行动或一系列行动或行为的所有过程,这些行动或行为将引导机器人实现其当前设定的目标。在人工智能和机器人学中,这一过程被称为-动作选择、仲裁以及规划。规划本质上是因果的,因为所选择的行动或行为预期会产生已知的效果,而不仅仅是与之相关。这一点在早期的规划[102]研究中已被指出,至今有时仍被明确提及,尽管大多数情况下它只是一个隐含的假设。

行动到效果的映射是硬编码或通过非-因果[103]或因果[104]方法学习得到的。前述的类别1–3均与这种因果学习相关。例如,机器人可能因撞向门而撞击门(类别1),门在被撞击时可能会摆动打开(类别2),而门的打开可能导致房间内的人转向门(类别3)。

在参考文献[105],中,应用因果推理来规划和协调多个清洁机器人。因果律在动作描述语言C+[106]中被形式化。并使用因果推理器CCALC[107]进行规划。参考文献[108],中对任务规划采用了类似的方法,其中动作领域和规划问题被表述为因果理论[107],使得因果模型对应于通过复杂求解器找到的规划解。

第8类. 因果创新

我们并未对该类别做出非常精确的定义,但认为有必要超越类别7,涵盖通常被称为“常识”或“人类水平智能”的内容。此类能力涉及一系列超出因果推理的认知技能,例如问题领域之间的相似性识别、观察的泛化、想象力、幻想和好奇心。然而,其中许多技能与回答反事实问题(见第2.2节)相关,例如:“如果我当时敲了那扇关闭的门而不是撞向它,会发生什么?”以及“那样做会有什么优势?”。这种因果推理被朱迪亚·珀尔置于三层因果层级的顶端,高于干预层次和关联层次[8]。反事实推理有时被认为是真正智能机器人所必需的能力,但在已发表的研究中却很少被应用。在参考文献[109],中,利用反事实推理寻找修改情景的方法,以使机器人控制器能够完成特定任务。通过调整观测到的情景数据,使得模拟机器人能够完成任务,从而生成新的“幻觉生成”(反事实)数据。

3.2 分类讨论

下面我们总结了八个已识别的因果认知类别。为了便于比较,每个类别后括号内给出了第2.3.1节中人类因果认知分类中最相似的等级。每个类别列出的相关技术指的是机器人学或其他被综述科学领域中的因果概念或技术,因此这些仅应被视为示例。

  1. 感知运动学习(1)–相关技术:运动牙牙学语
  2. 学习机器人如何影响世界(‐)–相关技术:干预
  3. 学习关于因果世界(6)–相关技术:实验
  4. 二元因果理解(2)–相关技术:镜像神经元
  5. 心智阅读(3,5)–相关技术:意图识别
  6. 脱离式心智阅读(4)–相关技术:统计因果推断
  7. 规划(‐)–相关技术:规划算法
  8. 因果创新(7)–相关技术:反事实推理

值得注意的是,人类因果认知的七个等级都可以与机器人学中现有的技术相关联。反过来看,类别2和类别7在这些等级中没有直接对应关系。然而,可以说类别2包含在等级1中,类别7包含在等级7中。

我们发现了机器人学领域早期的一些研究工作涉及了全部八个类别。然而,除了类别5之外,我们发现相关论文非常少,特别是那些明确提及与因果概念和推理联系的论文。

3.2.1 与人类因果认知分类的比较

我们的机器人因果认知分类与第2.3.1节中描述的人类因果认知的分类之间存在几个差异ff。其中一个差异涉及人类与非人类动物之间的区分。对于人类认知而言,这种区分很重要,因为与人类和非人类相关的推断被认为在进化过程中是分别发展的。因此,人类与非人类被划分到不同的等级中。此外,人类的推断被置于较低的等级,反映出这些能力被认为最先进化出来。我们选择将人类与非人类动物心智的推断合并到同一个类别5中,并且也将其他机器人视为可能的代理。主要原因是因果推断的条件非常相似。例如,理性假设应同时适用于对机器人’和人类’意图的推断。8

关于代理与非-代理的因果理解,我们保留了参考文献[5]中的区分。事实上,人类并没有任何用于模拟石头等物体的镜像神经元。而且石头通常不是被认为拥有可读取的心智。因此,对非代理的因果理解需要其他技术,例如类别3中描述的因果模型和实验。

另一个区别在于,我们将类别描述为与因果学习或因果推断相关。这是一个自然的选择,因为学习和推断在机器人中通常通过非常不同的技术来实现。此外,这种区分在认知心理学中也很常见(尽管在那里也总是存在不同的观点[110])。

我们还引入了两个我们认为对因果机器人至关重要的新类别。类别2涉及机器人学习其行动如何影响世界,类别7涉及规划,广义上涵盖关于如何行动的各种推断。

由于我们对类别进行了排序,参考文献中[5]的七个等级的层次排序不再保持。我们并不认为这是个问题,因为因果机器人的发展不应被期望遵循线性轨迹(人类因果技能的进化发展实际上也被认为同样不遵循线性轨迹’)。

3.3 感知‐规划‐行动之外的因果关系

机器人学不仅仅是为机器人设计感知、规划和行动的功能,因果关系在机器人学的其他领域和方面也起着重要作用。以下给出了一些例子,尽管这个列表无疑可以更长。

3.3.1 可理解的机器人

该领域可理解的机器人[112],有时被称为explainablerobots,或可说明的机器人,正受到越来越多的关注,并且与因果关系有多个联系。可理解的机器人应能够向交互的人类解释其行为的原因。这类解释在大多数情况下是因果的[113],甚至可能在所有情况下都是因果的[114],并且已被证明会影响人类对机器人的信任[115]。有关机器人学中解释生成研究的其他示例,参见文献[101,116–119]。

一个可理解的机器人不仅应传达其行为的原因,还应传达其未按预期行动的原因,以及它的目标、信念、欲望、局限性和能力[112]。所有为可理解性而进行的沟通都应遵循因果的分析告知或不告知互动的人的后果。例如,一个协助行人过马路的机器人,如果存在碰撞风险且行人很可能未察觉到正在接近的车辆时,应告知该情况。此外,机器人还必须决定何时、向谁以及以何种详细程度进行沟通[120]。所有这些决策都需要进行因果分析,以评估可用的替代方案。

3.3.2 机器人伦理

随着机器人变得越来越普及和自主,出现了许多新的伦理问题。其中许多问题都与因果关系密切相关。

一个主要的问题是如何设计机器人,使其行为符合其部署社会的社会规范。一种方法是实施规则或原则,以期望的方式规范机器人的行为。这要求机器人能够预测可能行动的后果,并生成通向期望目标的计划。为此,机器人至少需要来自类别2和类别7的因果技能(在一般情况下还需要所有其他类别的因果技能)。

一个具体的问题是如何确保机器人以无偏见和非歧视的方式行为。例如,服务员机器人应平等对待男女顾客,即性别本身不应影-响机器人服务顾客的顺序。当使用大数据训练决策支持系统时,这是一个普遍问题,因为这些系统往往继承了数据中的偏见[57]。从因果的视角来解决这一问题的方法最近才开始受到关注[121]。

另一个主要问题涉及机器人是否可以被视为对其行动负有责任。机器人或更一般地说,智能体的道德责任通常包含两个方面:因果责任和意图(参见例如参考文献[122])。在此,对某一事件具有因果责任意味着是该事件的原因,通常指在产生差异的意义上-(参见第2.2节)。在刑法中,这通常被表述为一个反事实问题:“若非被告的行动,受害者是否仍会遭受其所受的伤害?”[123]。意图作为道德责任的第二个组成部分,也与因果关系相关联。要使机器人具有导致某一事件发生的意图,它至少应意识到其行动或不行动如何导致该事件的发生。最终,我们认为具有道德责任的机器人(鉴于这是一个有争议的问题[124–126])将具备可能需要我们已确定的八个类别中的所有因果能力。因此,机器人必须登上珀尔的“因果阶梯”的最高层级[30],以掌握必要的反事实推理。

3.3.3 机器人学的机器学习

机器学习一直应用于机器人学,例如,用于开发对象识别和导航功能。因此,第2.4章节中提到的当前非因果的机器学习存在的问题也与机器人学密切相关。

机器学习在机器人学习如何行动方面也发挥着重要作用。我们之前提到了模仿学习(LfD)和逆向学习(IL)作为两种常见的学习范式。另一种范式是强化学习(RL),它与机器人学和因果关系都有明确的联系。在传统形式中,强化学习是一种机器人通过与环境的试错来形成最优行为的技术-(例如,参见参考文献[127])。机器人通过每次行动后获得的正负强化来学习在每个状态下应采取何种行动。这与干预(见第2.2节)有明显的相似之处:机器人学习的是行动与奖励之间的因果关系,而不仅仅是观测数据之间的相关性。由于现实中完整状态可能无法被观测到,因此可以认为强化学习并非完全无模型-,并且在从部分观测中估计隐状态或设计用于生成强化学习训练数据的模拟器时,通常需要某种程度的因果知识,并常常被隐式引入。在因果强化学习中,因果知识被显式引入,例如以因果图的形式,从而降低学习问题的维度-性。

3.3.4 机器人学研究方法

因果关系很重要,不仅是为了使机器人具备因果技能,而且也是常规机器人学研究方法的一部分。本文已多次提到随机对照试验(RCTs),作为一种机器人在因果推断中处理混杂变量的技术。然而,随机对照试验(RCTs)在就特定设计选择的结果得出因果结论,或评估外部因素如何影响机器人的功能及与人类的交互方面,也具有非常重要的作用。用户研究可能是验证关于人类对与机器人交互的感知的假设的最常见方法,并且经常组织为一项随机对照试验(例如,参见参考文献[130]以获取详细描述)。一个自变量指的是正在调查中的“因果事件” ,例如机器人声音的性别。该自变量被假设会影响因变量(也称为effect),例如用户满意度。随后将若干测试对象随机分配到不同的组,其中每组“接受不同的处理,”意味着自变量在各组中取不同的值。在该示例中,一组测试参与者会与具有男性声音的机器人互动,而另一组则与具有女性声音的机器人互动。由于采用了随机分配到组的方式,混杂变量的影响被降低,从而可以从自变量与因变量之间观察到的相关性中得出因果结论。在该示例中,实验的一个结论可能是:具有男性声音的机器人会使人们变得缺乏耐心。

路径分析是结构方程模型[132],的一种特殊情况,是一种更复杂的实验因果分析方法。在参考文献[133],中,使用结构方程模型研究了触觉感知(如果机器人是“柔软的”)与个性印象-(如果机器人是“健谈的,”等等)之间的关系。

因果学习对机器人的普遍重要性正受到越来越多的关注。在参考文献[34],中提出了一个用于开发和测试机器人因果学习算法的模拟器。该模拟器实现了基础物理功能,并允许用户通过模拟机器人定义积木世界操作任务,并对因果结构进行干预。

4 总结与结论

我们对因果关系在机器人学中的作用进行了两部分分析。第一部分是在感知–规划–行动层面对机器人因果认知提出的一种新颖分类,总结于第3.2节。我们还识别出每个类别与哲学、心理学以及计算机科学/统计学中的因果概念和技术之间的联系。对于大多数类别,相关出版物非常少。例外的是类别5:心智解读,其中一些关于机器人学学习的已发表工作认识到了因果推理的重要性。然而,因果关系很少被明确提及。

我们还讨论了超出感知–规划–行动层面的机器人学研究如何依赖于因果概念和假设,例如可理解性、机器伦理和研究方法。在这些情况下,因果关系也至关重要。在研究论文中很少被明确提及。如参考文献[134],中提到的一个原因可能是,因果关系的大多数理论发展都基于起源于计量经济学的结构方程模型[132]。这导致了研究重点集中在群体层面模型[135],上,例如描述社会中失业福利与失业水平之间的普遍因果关系[136]。尽管这类关系在计量经济学中可能具有相关性,但它们并未涉及特定失业个体获得特定失业福利之间的因果关系。这种关系更适合通过个体层面模型(如机制序列[134],)及其他方法[117,137],来处理,但遗憾的是,这类方法目前并不多见。对机器人而言,个体层面推理可能比群体层面推理更为重要,至少在机器人技术尚未远超当前水平的情况下是如此。另一个原因可能是,机器人学中相关的因果关系通常涉及高层级概念,而可用的数据通常来自激光扫描仪和超声波声呐等低层级传感器。在此方面,高层级感知(如物体分类、人脸识别、意图识别和情感识别)会更加合适,但这些领域的研究在真实世界场景中的通用性和鲁棒性方面仍面临挑战,而机器人通常正是在这些场景中运行。这意味着高层级感知难以直接应用于因果推理等复杂的认知计算中。

因果关系在已发表的机器人研究中极少被明确提及,这一事实可能带来多种后果。最严重的情况是,如果完全未考虑因果性,可能导致将数据中的相关性误认为因果关系的错误。当涉及数据驱动的机器学习时,这种风险尤其高。随着基于机器学习的子系统被集成到机器人中,这一风险也将成为机器人学领域的重要问题。也许不那么严重但仍然极不理想的情况是,尽管认识到因果关系是问题的一个重要部分,却没有识别并充分利用与哲学、认知心理学、统计学和计算机科学等其他研究领域的联系。这凸显了采用跨学科方法以将因果性充分融入机器人学研究的重要性。

我们希望本文fi通过阐明因果推理与机器人学之间广泛而深刻的联系,并指出其与其他研究领域的紧密关联,填补这一空白。从最好处设想,这将有助于在机器人学领域也掀起一场-“因果革命”。[54]同时推动机器人学的发展。

Matlab基于粒子群优化算法及鲁棒MPPT控制器提高光伏并网的效率内容概要:本文围绕Matlab在电力系统优化与控制领域的应用展开,重点介绍了基于粒子群优化算法(PSO)和鲁棒MPPT控制器提升光伏并网效率的技术方案。通过Matlab代码实现,结合智能优化算法与先进控制策略,对光伏发电系统的最大功率点跟踪进行优化,有效提高了系统在不同光照条件下的能量转换效率和并网稳定性。同时,文档还涵盖了多种电力系统应用场景,如微电网调度、储能配置、鲁棒控制等,展示了Matlab在科研复现与工程仿真中的强大能力。; 适合人群:具备一定电力系统基础知识和Matlab编程能力的高校研究生、科研人员及从事新能源系统开发的工程师;尤其适合关注光伏并网技术、智能优化算法应用与MPPT控制策略研究的专业人士。; 使用场景及目标:①利用粒子群算法优化光伏系统MPPT控制器参数,提升动态响应速度与稳态精度;②研究鲁棒控制策略在光伏并网系统中的抗干扰能力;③复现已发表的高水平论文(如EI、SCI)中的仿真案例,支撑科研项目与学术写作。; 阅读建议:建议结合文中提供的Matlab代码与Simulink模型进行实践操作,重点关注算法实现细节与系统参数设置,同时参考链接中的完整资源下载以获取更多复现实例,加深对优化算法与控制系统设计的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值