Cognitive architecture 又是个什么东东?

自Langchain:

https://blog.langchain.dev/what-is-a-cognitive-architecture/

https://en.wikipedia.org/wiki/Cognitive_architecture

定义

A cognitive architecture refers to both a theory about the structure of the human mind and to a computational instantiation of such a theory used in the fields of artificial intelligence (AI) and computational cognitive science.
hypothesis about the fixed structures that provide a mind, whether in natural or artificial systems, and how they work together — in conjunction with knowledge and skills embodied within the architecture — to yield intelligent behavior in a diversity of complex environments.

认知架构指的是一种人类心灵结构的理论,也可以指这种心灵结构理论在人工智能(AI)及计算认知科学领域中的计算实现。

一个产生思维的固定结构假设(无论是在自然系统还是人工系统中),该假设也说明了这些固定结构是如何与架构中所包含的知识和技能协同工作,从而在复杂环境的多样性中,产生智能行为。


这套理论说明非常费解, Langchain 研究员:

认知架构是指你的系统如何思考—— 换句话说,就是接受用户输入并执行操作或生成响应的代码/提示/LLM 调用的流程。

  1. “认知”:因为代理系统依赖于使用 LLM 来推理要做什么。

  2. “架构”:因为这些代理系统仍然涉及大量与传统系统架构类似的工程。


AI Agent 是一个用 LLM 来做程序的控制流决策的系统。

An AI agent is a system that uses an LLM to decide the control flow of an application.

Cognitive architecture

下面这张图展示了不同层次 Cognitive architecture 的例子:

从上往下不同 level, 从左→右不同阶段

图片

• 标准化的软件代码(code) :一切都是 Hard Code ,输出或输入的相关参数都直接固定在源代码中,这不构成一个认知架构,因为没有 cognitive 的部分;

• LLM Call ,除了一些数据预处理外,单个 LLM 的调用构成了应用程序的大部分,简单的 Chatbot 属于这一类;

• Chain:一系列 LLM 调用,Chain 尝试将问题的解决分成若干步,调用不同的 LLM 解决问题。复杂的 RAG 属于这一种:调用第一个 LLM 用来搜索、查询,调用第二个 LLM 用于生成答案;

• Router:在前面的三种系统中,用户可以提前知道程序会采取的所有步骤,但在 Router 中,LLM 自行决定调用哪些 LLM ,采取怎样的步骤,这增加了更多的随机性和不可预测性;

• State Machine ,将 LLM 与 Router 结合使用,这将更加不可预测,因为这样结合放入循环中,系统可以(理论上)做无限次的 LLM 调用;

• Agentic 的系统:大家也会称为“ Autonomous Agent ”,使用 State Machine 时,对于可以采取哪些操作以及在执行该操作后执行哪些流程仍然存在限制;但当使用 Autonomous Agent 时,这些限制将被删除。LLM 来决定采取哪些步骤、怎样去编排不同的 LLM ,这可以通过使用不同的 Prompt 、工具或代码来完成。

简单来说,一个系统越是“ Agentic ”,LLM 就越大程度地决定系统的行为方式。

Credit from: Agent 最全 Playbook:场景、记忆和交互创新  

混个 google agent whitebook

图:

图片

AI 小入门

快速开启 - ApiHug如何在15分钟内,使用 ApiHug 启动一个API开发项目.https://apihug.com/zhCN-docs/startApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplacehttps://plugins.jetbrains.com/plugin/23534-apihug--api-design-copilot

Soar(State, Operator, and Result)认知架构是一种用于建模人类认知过程的高层次理论框架,旨在模拟和解释人类如何感知、记忆、决策与学习。作为一种通用的认知模型,Soar被广泛应用于人工智能、认知科学和机器人技术等领域,以支持构建能够进行类人推理、持续学习和处理多样化任务的智能体[^2]。 ### 核心概念 Soar架构的基本思想源于问题解决的认知过程,其名称来源于三个关键组成部分: - **状态(State)**:表示当前的问题情境或环境状态。 - **操作符(Operator)**:代表可用于改变状态的动作或操作。 - **结果(Result)**:执行某个操作符后导致的新状态。 这些概念源自早期的问题解决理论,如Newell和Simon的通用问题求解器(GPS),而Soar在此基础上进行了扩展,使其适用于更广泛的任务和认知功能。 ### 架构原理 Soar采用了一种基于规则的生产系统(Production System),通过条件-动作规则(Condition-Action Rules)来驱动行为[^3]。其核心机制包括: 1. **感知输入**:Soar通过感知模块接收外部环境的信息,并将其转化为内部表示。 2. **工作记忆更新**:将感知到的信息整合进当前的工作记忆中,作为决策的基础。 3. **匹配规则**:在长期记忆中查找与当前状态匹配的规则,决定下一步的操作。 4. **冲突消解**:当多个规则同时满足时,使用预定义的策略(如优先级或最近使用频率)选择一个操作符。 5. **执行动作**:将选定的操作符作用于当前状态,生成新的状态并可能产生对外部环境的影响。 6. **学习机制**:Soar具备强化学习能力,能够在执行过程中通过经验积累优化规则库,提升未来决策效率。 ### 特点与优势 - **统一的学习机制**:Soar支持多种学习方式,包括试错学习、观察学习和知识迁移,使其能够在动态环境中不断适应。 - **符号与非符号结合**:除了传统的符号表示外,Soar也支持与神经网络等非符号方法的集成,增强其对复杂任务的处理能力。 - **模块化设计**:Soar的架构允许灵活添加感知、记忆、动作等模块,便于构建定制化的智能体。 - **跨学科适用性**:Soar不仅用于人工智能系统的开发,还广泛应用于认知心理学实验建模,帮助研究人类思维的运作机制[^2]。 ### 应用场景 Soar已被应用于多个领域,包括: - **机器人控制**:为机器人提供高层决策支持,实现自主导航与任务规划。 - **虚拟助手与游戏AI**:构建具有类人行为逻辑的虚拟角色。 - **教育系统**:模拟学生认知过程,辅助个性化教学设计。 - **认知科学研究**:验证关于人类记忆、注意和问题解决的理论假设。 ```python # 示例:Soar风格的简单规则系统伪代码 rules = { "if current_state == 'hungry' and has_food then eat_food", "if current_state == 'tired' then rest" } def apply_rule(state): for rule in rules: condition, action = rule.split("then") if eval(condition.strip()): return eval(action.strip()) return "no_action" ``` ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ApiHug

God Bless U

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值