基于控制论阶次的机器人分类

机器人技术:从一阶控制论到三阶控制论

摘要

各阶控制论的一般原则在半个世纪前就已经被提出。然而,这些原则主要应用于哲学、社会学、生物学、经济学以及可称为人文学科的类似领域。工程技术人员在其工作中几乎未应用这些原则。本文尝试从一阶、二阶和三阶控制论的角度,探讨并阐述这些原则在机器人系统控制任务中的应用。文章提出了一种新的机器人系统分类原则,该原则基于与控制论学者代际的关联。需要指出的是,所提出的这一原则可扩展至其他工程与技术领域,例如认知架构、人工神经网络或遗传算法。

关键词 : 一阶控制论;二阶控制论;三阶控制论;信息物理系统;机器人;控制系统。

1. 引言

控制论中的“阶”划分,从最一般的意义上讲,控制论可被定义为基于系统状态信息处理的系统控制科学。这是一个非常传统的定义,但它使我们能够突出研究主体及其所用手段的主要特征。本文的目的是从各阶控制论的角度,探讨并阐述一类机器人复合体(RC)控制的基本原理和任务。RC属于复杂信息物理系统,在这一领域,据我看来,当前所有最复杂的控制论理论和方法都集中应用于实际项目中。在讨论RC类别时,应明确指出,本文将重点讨论用于RC控制系统设计的方法和算法。值得注意的是,许多关于其设计与实现的原则和方法,实际上属于各阶控制论,这些原则和方法由科学家们发展而来,以及工程师在不考虑各阶控制论问题的情况下进行的。因此,从理解一阶、二阶和三阶控制论所面临任务的角度来分析、概括和理解这一经验是很有意义的。

2. 一阶、二阶和三阶控制论

尽管将控制论划分为不同阶的思想出现在上个世纪70年代,但对于包括机器人技术在内的工程应用而言,这些控制论的本质尚无事实上的标准定义。

2.1. 一阶控制论

经典控制论,正如诺伯特·维纳所定义的那样,是研究机器、生物体和社会中控制与信息传递的一般规律的科学[1]。需要强调的是,在维纳对控制论的定义中,“机器”位列首位,其次才是“生物体和社会”。维纳是一位数学家,主要从事技术系统的项目工作。尽管存在控制论的“经典定义”,但在各种文章中却可以找到对该定义截然不同的诠释。以下是一些例子:“基于经典科学理性思想的经典控制论本质的确定” [5]。“一阶控制论对应于经典科学理性,其基础是‘主客体’范式”[6]。“一阶控制论处理可观测系统,并涉及异源机器”[8]。“从控制论的角度看,每个系统都通过创造某种时空形式和认知秩序来减少熵。对于一阶控制论系统而言,计算机‐通信‐控制三元组即是其实现手段”[10]。控制论一阶、二阶和三阶的cs未由科学和技术工作者定义rs!

2.2. 二阶控制论

上个世纪50年代,二阶控制论范式的创建者被认为是几位非常严肃且知名的科学家:A.S.比尔(运筹学、社会系统)、W.R.阿什比(精神病学家、控制论专家)以及W.S. 麦卡洛克(神经生理学家、神经网络、控制论的创建者之一),他们开始发展“二阶控制论”,这与N. 维纳的经典控制论[2]有所不同。在[3],中提供了关于一些科学家在发展二阶控制论概念过程中所起作用的相当详细的历史信息,例如H. 冯·福斯特(物理学家、数学家、控制论专家)和G. 巴特森(哲学家、控制论专家、社会学家、人类学家)。他们将经典控制论的理念转向了生物知识的本质,并强调主体的作用。即使在经典控制论的定义中也存在多种不同的解释,而在二阶控制论的定义中,更不存在统一的正式明确的定义。以下是一些作者定义的示例: H. 冯·福斯特在其文章《控制论的控制论》[3],中区分了一阶控制论——被观察系统的控制论,以及二阶控制论——观察系统的控制论。“二阶控制论”的支持者认为,知识是一种生物现象(翁贝托·马图拉纳,生物学家),每个个体建构自己的“现实”(H. 冯·福斯特),而知识与感官经验的世界是“一致的”而非“相同的”(恩斯特·冯·格拉斯费尔德,哲学家)[3]。

与“维纳”一维(“坐标”)相比,多维(“坐标” ‐ “参数” ‐ “结构”)的“二阶控制论”。A.S.比尔等人指出,它最初关注的是生物圈和诺斯圈中对象的控制,包括——社会关系的管理,特别是人际关系的管理,例如在工业企业资金流的演变中表现出来。在上述作者的著作中提到[3], “二阶控制论” 是“复杂性管理”,其目的不在于像“维纳控制论”那样对控制对象的变化做出反应,而在于对这些变化的趋势做出反应。这反过来通过影响“控制对象的整体性和内部关联性,从而在其内部维持稳态和自组织”来实现[3]。

由于描述“二阶控制论”对象的状态数量具有超维度性⋯⋯此类影响,尽管需要维持上述所有“稳态”和“自组织”,但在任何“二阶”的控制论系统中,只可能存在三种且仅有三种(不再更多!其他种类根本无从产生),即除了“维纳”对“二阶控制论”系统中坐标的影晌之外,还应存在另外两种影晌,分别是参数的影响以及对对象结构的影响。结果表明,从纯粹的“维纳”一维坐标控制转变为坐标‐参数控制,进而再转变为结构控制的必要性判据,是控制对象[3]不满足R. 卡尔曼准则。这实际上是判断一个系统是否属于二阶控制论的唯一具体方法!

在多位作者的文章中可以找到或多或少明确的定义的另一个版本,例如[4,6]。这种定义如下:“⋯⋯引入二阶控制论的概念是为了强调被观察系统的控制论与观察系统的控制论之间的区别。在二阶控制论中,观察者本身被视为一个控制论系统,参与构建另一个控制论系统的模型。”

然而此外,还有大量更非特定的表述,以下是一些示例s. “二阶控制论基于经典科学理性的思想”[5]。“第二nd 控制论涉及观测系统或自创生(活体机器)”[8] “对于二阶控制论系统而言,熵的减少是由整合‐学习‐适应三元组所触发的”[10]。

2.3. 三阶控制论

一种相对较新的范式,提出了现代控制论所涉及的更新的理解、方法论和任务范围,例如[4‐7]。在三阶控制论中,首要地位的是:系统的智能组成部分、人对其运行的积极参与,而且重要的是,人不仅是作为操作者,更是作为伙伴参与其中。三阶控制论将系统更多地视为复杂控制方案中的一个主动交互元素。

目前,关于三阶控制论的主要研究工作由来自社会学、生物学、经济学、情感心理学、艺术理论和哲学领域的科学家开展。该范式在技术与工程科学领域中的应用实例还非常少。

在俄罗斯,三阶控制论的方法论思想由俄罗斯科学院院士В.С. 斯捷宾、В.А. 列克托尔斯基和教授 В.Е. 列普斯基在其著作中加以发展,他们是这一范式在俄罗斯的主要推广者。他们在出版物和演讲中首先讨论了这一范式的哲学和方法论基础。特别是В.Е. 列普斯基的著作中给出了该方法论在经济学领域应用的若干实例。

必须指出的是,与二阶控制论一样,三阶控制论也没有单一的正式定义。以下是一些作者的定义,显示出相当多样的解释:

作者提出了关于第三代控制论的概念[5] ,即“自发展多主体环境的经济控制论”,该理论应基于“后非经典科学理性”的思想。

在[3, 4],中,提出应关注智能成分以及系统在运行过程中的自发展,其中控制决策发展的关键因素是主体对价值‐目标取向的理解。

三阶控制论是在后非经典科学理性的基础上形成的。其关注重点是自我发展的多主体(反思主动型)环境。主导范式为“主体‐元主体”(自我发展的多主体环境)”[6]。

第三代研究相互可观察系统,其分析对象是语言,作为一种认知机器,在生命系统之间创建共同的交互区域[8]。

三阶控制论基于四个价值:人的保存与发展、人类的保存、生物圈的保护、技术圈的保存与发展[7, 11]。

R.G. 曼西利亚[9] 表示,从社会学和政治学的三阶控制论角度来看,“权力、文化与制度”非常重要。

对于三阶控制系统,该阶次由整体性‐生成‐进化三元组[10]来考虑。

示意图0

3. 科学与工程项目中控制论阶次的范式

在科学与工程项目中,控制论范式的应用实例非常少。如果我们考察各阶控制论思想在工程与技术领域的应用,那么其主要类别应该是信息物理系统。然而,在科学与技术项目的描述中,几乎找不到几个使用这些范式的实例。

在预印本[4],中,作者(为数不多的研究者之一)将三阶控制论与对抗性冲突建模问题相关联,采用三阶控制论范式作为基于博弈论解决该问题的新方法。文中还展示了使用有限自动机理论解决类似问题的相关研究。所提出的方法归结为一个形式化任务,即评估对手在某个假设区域中的移动条件,该区域条件性地反映了其状态空间,并考虑了冲突主体的状态特征,如影响和机动性[4]。该方法通过软件代理技术实现。预印本还展示了所提方法在机器人技术中的应用可能性。这项工作属于社会冲突建模和大规模人群行为研究领域,但通过使用形式化数学工具,该方法也可应用于工程项目。

可以阐述三阶控制论思想的主要区别:在三阶控制论中,人不仅被纳入控制回路,而且作为复杂信息物理系统的一个环节被包含在内,此外,智能方法的思想在控制系统中也得到了积极应用。由于智能控制方法不仅在机器人技术中得到广泛应用,例如[20,21], ,而且在许多其他领域也有应用,例如[18, 19], ,因此有必要将本文的思想扩展到这些领域。

4. 基于代际的机器人分类

机器人复合体(RC)是一类规模庞大的信息物理系统。在各类技术领域中,存在一些分类系统,用于表征该技术的代际划分。典型示例包括计算机代际或超级计算机技术代际。在这些分类中,基本原则是每个具体样机归属于其研发所处的时代。这使得能够方便地将特定设备归入某一类别,并以其所属时期的科技所具有的普遍特性进行表征。类似的原则也被应用于机器人系统代际的分类。此类分类可在互联网上的文章[16‐17]中找到。然而,在更为严谨的文章中,对机器人系统(RC)项目的划分不仅依据其实施年份,还结合了其功能与智能能力的提升。至多,可给出如下机器人系统代际的划分:
1. 第一代机器人——编程机器人(programmed robots)。
2. 第二代机器人是有感知能力的机器人。
3. 第三代机器人——智能机器人。它们与第二代机器人在控制系统中的复杂性和完善性方面有根本区别,其控制系统包含了人工智能元素。[15‐17]。

此类分类的主要缺点在于:其普遍原则仅基于时间段,即特定技术,并且实际上只是从历史层面考虑机器人技术的发展。这一原则虽然简单且方便,但并未考虑到机器人控制系统(RC)的复杂性、方法以及智能程度。因此,这种分类对科学与工程界并不具有太大吸引力!汉斯·P·莫拉维克教授[13, 14]提出了一个在我看来更有趣且更正确的分类原则,该原则取决于机器人系统(RC)的“智能能力”。根据他的分类,第一代RC的智能能力相当于蜥蜴,第二代相当于老鼠,第三代相当于猴子,而只有第四代才对应于人类智能。这个想法很好,但如何衡量老鼠或猴子的智能水平呢?这一想法在实际应用中并不太适用。

4. 提出的分类

建议根据机器人系统与控制论系统代际关联的原则,来考虑机器人系统的代际划分。这似乎将是对现有机器人系统更为客观的分类。在这方面,我们可以考虑例如机器人系统(RC)的以下四代。

  1. 第一代是具有刚性控制系统的机器人 。需要注意的是,这类技术系统50年前就已存在,至今仍然存在。我们可以有把握地认为,它们在未来也将继续存在。重要的是,它们采用多种技术进行开发,但其控制系统具有一般性原则。例如:在汽车生产线输送带上工作的现代机械手,并执行相同的固定操作。需要强调的是,无论是用于汽车装配线的现代机器人臂,还是上个世纪类似的机械手,都属于第一代,因为它们的控制系统是根据相同的原则设计的,尽管它们的生产技术完全不同。

  2. 建议将第二代归类为机器人系统(RC) ,其控制系统主要基于系统中包含人类操作员的原则。目前,这一管理原则在实际应用领域中实际运行的机器人系统数量方面占据主导地位。与第一代机器人相比,此类控制系统中的机器人系统是一种更为灵活的技术系统。它能够根据环境和情况改变其功能,但这主要得益于人类操作员的积极参与。例如,我们仍可以引用汽车装配线上的机器人系统(RC)类机械臂。然而,在这种情况下,该机械臂具有复杂控制系统,能够部分分析外部环境并执行人类操作员的指令,从而在半自动模式下完成大量操作。

  3. 第三代机器人是这样一类系统 ,其特点是机器人控制系统所做决策的独立性成为其控制系统的首要原则。同时,表征此类机器人系统的一个重要情况是,这类技术系统可以作为由人和其他机器人组成的团队的一部分运行。此外,这类机器人的自主性非常高。例如,在工厂机器人技术领域中的一个实例:在汽车装配线上工作的机器人‐机械手,它们与其他机器人以及与人类协同工作。在这种情况下,机器人和人在各自执行操作任务的同时,可以彼此近距离共处并相互协助完成一些复杂的操作。这类机器人系统(RC)的控制系统需要智能算法。

  4. 第四代机器人是完全自主的机器人控制系统 。未来,这一类别可能需要进一步划分为多个世代,例如将具备自我复制能力的机器人系统单独划分为一个世代。但这属于未来的问题。

示意图1

结论

  • 建议的分类基于与控制论学者代际的关联。在实践中,这意味着它取决于机器人控制系统(RC)的复杂性和智能水平。
  • 这种分类与用于制造机器人系统(RC)的技术无关。
  • 这种分类与所使用的机器人系统(RC)机电电路无关。
  • 这种分类不依赖于机器人的“世界”及其用途类型:固定式、移动式、地面、飞行器或无人机(无人机)、水面、水下、太空、外星等。
  • 这种分类与特定机器人系统(RC)中所使用的传感器和执行器的类型无关。
  • 当然,所提出的原理可以进一步阐明并需要更详细的说明。
  • 本文中提出的许多观点和思想在某些著作中已有体现。但本文作者认为,这些原则应当被更严格、更具体地“固化”下来。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值