认知架构:BDI、包容架构与CLARION的深入剖析
在人工智能与认知科学领域,不同的认知架构为模拟人类思维和行为提供了多样化的途径。本文将详细介绍BDI架构、包容架构和CLARION架构,并对这几种架构进行功能对比。
1. BDI架构
BDI(Belief-Desire-Intention)架构基于人类实践推理理论和丹尼特的意向系统理论,旨在设计一个能在动态环境中进行推理和规划的系统。
1.1 架构组成
- 数据库 :包含关于世界的信念或事实,以及用于获取新信念的推理规则。数据库由信念和计划库组成,信念会随着对环境的感知和意图的执行而更新。
- 计划 :是BDI代理为实现一个或多个意图而执行的一系列动作,属于声明性知识。计划由主体和调用条件组成,主体包含实现目标的可能行动和程序,调用条件规定了计划执行的先决条件。计划还可能包含子目标,执行过程中可能会产生新的子目标,形成目标 - 子目标层次结构。
- 欲望(目标) :是BDI代理试图实现的目标,在该架构中,“目标”一词仅用于非冲突的欲望,欲望之间的冲突通过奖励和惩罚来解决。当执行满足目标描述的行为时,目标被认为成功实现。
- 意图 :是代理承诺执行的欲望,包含系统选择执行的所有任务。每个意图实现为一个计划实例栈,只有当计划的上下文与信念的结果匹配时,意图才被认为是可执行的。
- 事件队列 :代理的感知映射到存储在队列中的事件,当有信念的获取或移除、消息的接收以及新目标的获取时,会发生事件,因此事件是系统的输入。
1.2 功能与过程
系统解释器操纵BDI架构的所有组件,其工作流程如下:
1. 通过感知和内部动作更新事件队列,以反映观察到的事件。
2. 选择事件。
3. 通过在计划库中查找与所选事件相关的计划,生成新的可能欲望。
4. 从相关计划集中选择一个可执行计划,并创建一个实例计划。
5. 将实例计划推送到现有的(当计划由内部事件触发时)或新的(当计划由外部事件触发时)意图栈。
6. BDI代理通过获取新信念时的数据库或执行意图期间执行的动作与环境进行交互。
7. 意图执行后,解释器循环重复。只有获取新信念或目标才会导致计划的改变,并使代理处理另一个意图。
BDI架构将手段 - 目的推理与决策知识的使用相结合,一旦致力于实现目标的过程,就不会考虑其他可能更好的途径,从而节省决策时间。当系统识别出目标已实现或无法轻易实现时,会放弃目标。
最初的BDI架构缺乏学习机制,但近年来有一些尝试将学习机制纳入BDI系统,例如Norling扩展BDI以进行学习识别启动决策,Subagdja和Sonenberg通过生成和测试假设来制定计划以实现学习,Guerra - Hernandez等人在多智能体系统中使用决策树的自上而下归纳来实现学习。
2. 包容架构
包容架构是人工智能领域中源自基于行为的机器人技术的“新”概念,旨在解决经典人工智能在可扩展性、鲁棒性和实现多个目标方面的问题。
2.1 架构组成
包容架构由一系列基于简单行为的模块组成层次结构,组织成不同的层(能力级别)。所有层都可以访问传感器数据,多个简单行为可以并行操作。每层都能够独立控制系统,与经典人工智能代理不同。较低层像快速适应机制,使代理能够快速对环境变化做出反应;较高层则控制整个系统朝着总体目标前进。为了实现更高的能力级别,可以简单地添加新的控制层,而无需更改现有层。
2.2 功能与过程
包容架构的特点如下:
- 无符号处理:不存在显式的知识表示,因此无需进行规则匹配,系统的任何级别都无需做出决策。
- 无中央控制:架构的各层由收集的数据驱动,没有全局数据或动态通信,系统通过对事件的响应来实现活动,感知与动作在每层紧密耦合。
- 层间通信:层间通信是单向的,层间交互最少,但较高层可以抑制较低层的输入和输出,以调整行为以实现总体目标。
- 抗干扰能力:该架构能够应对由于不完美的感官信息或环境的不可预测性而产生的噪声,通过设计多个分布式行为层,降低了系统因环境剧烈变化而崩溃的可能性,使系统性能能够逐渐下降,而不是在面对非理想输入时完全失败。
- 易于实现:基于层的设计使得系统的每个模块可以在进入下一个更高级别之前进行测试和调试,这种增量式、自下而上的方法确保了系统的可操作性,并简化了调试过程。
3. CLARION架构
CLARION(Connectionist Learning with Adaptive Rule Induction ON - line)架构源于连接主义系统(即神经网络),是一种混合架构,结合了隐式和显式记忆进行推理和学习。
3.1 架构组成
CLARION架构由两层组成:
-
顶层
:包含命题规则,采用显式符号机制。
-
底层(反应层)
:包含程序知识,使用亚符号神经机制。程序知识可以通过强化学习逐步积累,声明性知识通过试错法进行规则提取来获取。架构会同时参考顶层和底层,以选择每个步骤中最合适的动作。
此外,CLARION架构还包括非以行动为中心的子系统(NACS)和以行动为中心的子系统(ACS):
-
NACS
:主要包含声明性知识,顶层是通用知识库(GKS),包含显式表示;底层是关联记忆网络(AMN),包含隐式表示。
-
ACS
:主要包含程序知识,顶层存储显式动作规则,这些规则可以由代理的外部环境提供或从底层信息中提取;底层由隐式决策网络组成,可以通过强化学习进行训练。
3.2 功能与过程
CLARION的学习分为隐式学习和显式学习:
-
隐式学习
:学习程序技能,底层程序知识的学习通过强化学习范式进行,即通过调整选择特定动作的概率来工作。当动作获得正强化时,选择该动作的机会增加;否则,选择机会减少。学习过程采用神经网络机制,如多层神经网络和反向传播算法,用于计算Q值,当执行动作使情况变好时,动作的Q值上升,执行该动作的倾向增加。
-
显式学习
:学习声明性知识中的规则,顶层规则的学习通过从底层提取信息进行。当动作成功执行时,代理提取与底层选择的动作对应的规则,并将其添加到规则网络中,同时移除更具体的规则,只保留通用规则。然后,代理通过在后续与环境的交互中尝试这些规则来验证所学规则。如果执行动作导致尝试失败,规则会被修改得更具体,排除当前情况;如果尝试成功,规则会被泛化,使其应用更广泛。
此外,CLARION结合了基于规则的推理和基于相似性的推理来模拟人类推理,推理通过比较已知块与另一个块进行,当两个块的相似度足够高时,可以对它们之间的关系进行推断。推理过程可以迭代进行,以找到所有可能的结论。
4. 六种认知架构的功能对比
为了更好地理解不同认知架构的特点,我们从感知、记忆、目标、问题解决、规划、推理/推断和学习等七个功能领域对六种认知架构(Soar、ACT - R、ICARUS、BDI、包容架构和CLARION)进行对比,具体如下:
| 架构 | 感知方式 | 工作记忆 | 长期记忆 | 目标表示 | 规划机制 | 问题解决机制 | 推理/推断机制 | 学习机制 |
|---|---|---|---|---|---|---|---|---|
| Soar | 感知输入直接存储为工作记忆的一部分 | 包含感知、状态和与当前情况相关的生产规则 | 包含程序、声明性(语义)和情景记忆 | 目标表示为工作记忆中的状态,支持目标 - 子目标层次结构 | 决策周期选择合适的动作,使系统更接近目标 | 手段 - 目的分析,选择合适操作符的决策程序 | 规则匹配将相关知识带到工作记忆,细化阶段创建偏好 | 分块创建新的生产规则,强化学习更新每个规则的奖励,情景和语义记忆辅助决策 |
| ACT - R | 感知存储在视觉模块中,通过视觉缓冲区可用 | 包含目标、感知、相关知识和运动动作在各个缓冲区 | 声明性模块中的声明性知识和生产系统中的感知知识 | 目标存储在国际模块中,通过目标缓冲区可用 | 通过创建子目标进行规划 | 通过贝叶斯框架中块的激活和块与规则匹配时的生产规则触发 | 概率推理 | 生产编译将多个生产规则减少为一个 |
| ICARUS | 感知存储在感知缓冲区中,作为概念记忆的一部分 | 由感知缓冲区、信念记忆和短期技能记忆组成 | 长期技能记忆中的程序知识,长期概念记忆中的声明性知识 | 目标放置在目标栈中,支持目标 - 子目标层次结构 | 通过技能实例化进行规划 | 通过搜索和回溯进行手段 - 目的分析 | 概念子句的布尔匹配,自下而上和数据驱动 | 技能学习 |
| BDI | 感知映射到存储在事件队列中的事件 | 信念作为工作记忆 | 计划作为长期记忆 | 非冲突目标作为欲望,支持目标 - 子目标层次结构 | 预定义计划存储在计划库中 | 手段 - 目的分析 | 程序推理系统 | Q学习,自上而下的决策树归纳,从解释中学习 |
| 包容架构 | 通过传感器获取感知 | 无显式工作记忆 | 每层中的启发式方法 | 不同层的多个模块中有多个目标,允许多个并行目标处理 | 通过任务分解进行隐式规划 | 无显式问题解决机制 | 无推理机制 | 无学习机制,对环境的反应预先连接到每个模块 |
| CLARION | 感知输入表示为维度/值对 | 作为临时信息存储,底层为程序知识,顶层为声明性知识 | 目标存储在目标结构中,如目标栈或目标列表 | 通过Q值空间中的束搜索进行规划 | 结合底层计算的Q值和顶层规则选择行动过程 | 集成基于规则的推理和基于相似性的推理 | 底层(程序知识)进行Q学习,顶层(声明性知识)进行规则提取 |
通过以上对比可以看出,不同的认知架构在各个功能领域具有不同的特点和优势,适用于不同的应用场景。在实际应用中,需要根据具体需求选择合适的认知架构。
下面是BDI架构工作流程的mermaid流程图:
graph LR
A[更新事件队列] --> B[选择事件]
B --> C[生成新欲望]
C --> D[选择可执行计划]
D --> E[创建实例计划]
E --> F[推送到意图栈]
F --> G[与环境交互]
G --> H{意图执行完成?}
H -- 是 --> I[循环重复]
H -- 否 --> G
J{获取新信念或目标?} --> K -- 是 --> D
J -- 否 --> I
通过对这些认知架构的深入了解,我们可以更好地利用它们的优势,为人工智能和认知科学的研究与应用提供有力支持。
认知架构:BDI、包容架构与CLARION的深入剖析
5. 各认知架构功能特点深入分析
5.1 感知功能
- Soar :外部环境信息通过感知模块直接进入工作记忆,这种方式使得信息获取直接且高效,能快速将外界信息纳入系统处理流程。
- BDI :将感知转化为事件存储在队列中,以事件为单位处理感知信息,便于对不同类型的感知进行分类和管理。
- 包容架构 :专为机器人设计,通过传感器获取环境数据,这种方式与机器人的物理特性紧密结合,能直接获取物理世界的信息。
- CLARION :把感知输入表示为维度/值对,这种表示方式更具抽象性,便于在后续的推理和学习过程中进行处理。
| 架构 | 感知特点 |
|---|---|
| Soar | 信息直接进入工作记忆,高效获取外界信息 |
| BDI | 感知转化为事件存储,便于分类管理 |
| 包容架构 | 通过传感器获取数据,贴合机器人物理特性 |
| CLARION | 以维度/值对表示,抽象性利于后续处理 |
5.2 记忆功能
- Soar :采用集中式工作记忆,包含感知、状态和生产规则等多种信息,为问题解决和决策提供全面的数据支持。
- BDI :工作记忆为信念,长期记忆为计划,这种划分明确了不同类型信息的存储位置,便于在推理和规划过程中快速访问。
- 包容架构 :没有显式的工作记忆,每层有各自的启发式方法,这种设计减少了系统的复杂性,提高了反应速度。
- CLARION :工作记忆作为临时信息存储,底层存储程序知识,顶层存储声明性知识,分层存储不同类型的知识,便于不同学习和推理机制的应用。
| 架构 | 工作记忆 | 长期记忆 |
|---|---|---|
| Soar | 集中式,含多种信息 | 程序、声明性和情景记忆 |
| BDI | 信念 | 计划 |
| 包容架构 | 无显式工作记忆 | 每层启发式方法 |
| CLARION | 临时存储,分层存储知识 |
5.3 目标功能
- Soar :目标表示为工作记忆中的状态,支持目标 - 子目标层次结构,这种表示方式便于对复杂目标进行分解和管理。
- BDI :非冲突目标作为欲望,同样支持目标 - 子目标层次结构,通过奖励和惩罚解决欲望冲突,使目标管理更加灵活。
- 包容架构 :不同层的多个模块中有多个目标,允许多个并行目标处理,适合处理多任务场景。
- CLARION :目标存储在目标结构中,如目标栈或目标列表,方便对目标进行组织和操作。
| 架构 | 目标表示特点 |
|---|---|
| Soar | 以状态表示,支持层次结构 |
| BDI | 非冲突欲望,支持层次结构,解决冲突灵活 |
| 包容架构 | 多模块多目标,并行处理 |
| CLARION | 存储在目标结构中,便于组织操作 |
5.4 问题解决功能
- Soar :采用手段 - 目的分析和选择合适操作符的决策程序,通过不断调整操作符来接近目标。
- BDI :同样使用手段 - 目的分析,结合预定义计划,在已知计划中选择合适的方案来解决问题。
- 包容架构 :没有显式的问题解决机制,通过任务分解进行隐式规划,更注重对环境的快速反应。
- CLARION :结合底层计算的Q值和顶层规则选择行动过程,综合考虑了程序知识和声明性知识。
| 架构 | 问题解决机制特点 |
|---|---|
| Soar | 手段 - 目的分析,调整操作符 |
| BDI | 手段 - 目的分析,结合预定义计划 |
| 包容架构 | 任务分解隐式规划,快速反应 |
| CLARION | 结合Q值和规则选择行动 |
5.5 规划功能
- Soar :通过决策周期选择合适的动作,使系统逐步接近目标,是一种动态的规划方式。
- BDI :预定义计划存储在计划库中,根据当前情况选择合适的计划,这种方式适用于已知场景的规划。
- 包容架构 :通过任务分解进行隐式规划,各层独立工作,共同实现整体目标。
- CLARION :通过Q值空间中的束搜索进行规划,利用强化学习的结果进行路径选择。
| 架构 | 规划机制特点 |
|---|---|
| Soar | 动态选择动作接近目标 |
| BDI | 预定义计划选择 |
| 包容架构 | 任务分解隐式规划 |
| CLARION | Q值空间束搜索 |
5.6 推理/推断功能
- Soar :通过规则匹配将相关知识带到工作记忆,细化阶段创建偏好,利用规则进行推理。
- BDI :采用程序推理系统,根据预定义的程序进行推理。
- 包容架构 :没有推理机制,更侧重于对环境的直接反应。
- CLARION :集成基于规则的推理和基于相似性的推理,模拟人类的推理方式。
| 架构 | 推理/推断机制特点 |
|---|---|
| Soar | 规则匹配和细化创建偏好 |
| BDI | 程序推理系统 |
| 包容架构 | 无推理机制 |
| CLARION | 集成规则和相似性推理 |
5.7 学习功能
- Soar :通过分块创建新的生产规则,强化学习更新每个规则的奖励,利用情景和语义记忆辅助决策,不断优化系统性能。
- BDI :采用Q学习、自上而下的决策树归纳和从解释中学习等多种方式,增强系统的适应性。
- 包容架构 :没有学习机制,对环境的反应预先连接到每个模块,适用于固定场景。
- CLARION :底层进行Q学习,顶层进行规则提取,结合隐式和显式学习。
| 架构 | 学习机制特点 |
|---|---|
| Soar | 分块、强化学习和记忆辅助 |
| BDI | 多种学习方式结合 |
| 包容架构 | 无学习机制 |
| CLARION | 底层Q学习,顶层规则提取 |
6. 认知架构选择建议
在实际应用中,选择合适的认知架构至关重要。以下是根据不同应用场景的选择建议:
1.
需要处理复杂目标和动态环境
:Soar和BDI架构较为合适。Soar的动态规划和手段 - 目的分析能力,以及BDI的目标管理和计划选择机制,能够应对复杂多变的情况。
2.
注重快速反应和多任务处理
:包容架构是不错的选择。其分层结构和并行处理能力,使其能够快速对环境变化做出反应,同时处理多个任务。
3.
需要模拟人类学习和推理
:CLARION架构更具优势。它结合了隐式和显式学习,以及基于规则和相似性的推理,能够更好地模拟人类的认知过程。
下面是选择认知架构的mermaid流程图:
graph LR
A[应用场景] --> B{复杂目标动态环境?}
B -- 是 --> C[Soar或BDI]
B -- 否 --> D{快速反应多任务?}
D -- 是 --> E[包容架构]
D -- 否 --> F{模拟人类学习推理?}
F -- 是 --> G[CLARION]
F -- 否 --> H[根据其他需求选择]
综上所述,不同的认知架构在各个功能领域表现出不同的特点和优势。在实际应用中,我们应根据具体需求,综合考虑各架构的特点,选择最合适的认知架构,以实现最佳的系统性能。通过深入研究和理解这些认知架构,我们能够更好地推动人工智能和认知科学的发展,为解决各种复杂问题提供有力的支持。
三大认知架构深度解析
超级会员免费看
15

被折叠的 条评论
为什么被折叠?



