【颠覆认知】M1/M2机器理论:告别LLM“幻觉“,大模型开发者必学的企业级架构!

编者摘要:本文是西班牙学者的机器学习的研究成果。围绕智能体Agentic AI 的发展与转型展开,核心提出M1/M2 机器理论(将机器学习拆解为 “学习(L)” 与 “机器(M)”,M1 聚焦模型校准与部署,M2 侧重企业级算法生态构建),批判当前行业对 LLM 的过度依赖(认为其结构性 “幻觉” 导致95% AI 项目失败),强调Strategies-based Agentic AI(基于算法化(Algorithmization)的联邦式、模块化架构)才是生产级 B2B 转型的关键;通过十年实践(从算法交易 M1 到全企业 M2 落地)验证了该架构的可行性,同时区分了Science、Science Applied 与 Applied Science的概念边界,最后规划了未来二十年从企业到社会层面的转型蓝图,为 Agentic AI 的规范化发展提供了理论与实践支撑。

一、研究背景与核心目标

  1. 行业现状
  • 智能体(Agentic AI )成为全球热点,但概念模糊,过度绑定 LLM,导致技术期望与生产级需求脱节;
  • 关键痛点:LLM 的 “幻觉” 是结构性属性(源于统计估算而非信息检索),而非偶然缺陷,叠加95% AI 项目失败(MIT 2025 报告),企业亟需可靠的转型架构;
  1. 目标
  • 厘清 智能体Agentic AI 的概念与边界,区分 Science、Science Applied 与 Applied Science;
  • 提出 M1/M2 机器理论,推广 Strategies-based Agentic AI,为企业级 B2B 转型提供理论与实践支撑。

二、理论框架

2.1 关键术语定义
术语核心定义
AI机器学习 + 营销叙事,尚无系统具备实质智能
智能生成精准样本外异常值的能力
ML计算统计学分支,分为 Traditional(闭式表达式)与 Computational(迭代收敛)两类
Science聚焦模型(f(\cdot))的设计与验证(如统计理论)
科学应用Science Applied模型的工程化部署(M1 核心,如 LLM 的训练与 API 服务)
应用科学Applied Science整合模型、启发式、业务规则的算法化系统(M2 核心,如企业级算法生态)
2.2 M1/M2 机器理论(核心创新)
维度M1(第一机器)M2(第二机器)
核心定位Science Applied,模型的校准与部署Applied Science,企业级算法生态构建
技术焦点数据工程、硬件管理、模型 serving(如 LLM 训练 / API 部署、算法交易系统)联邦式架构、模块化智能体、跨部门协同(如 MAUs/MAEs/MAPs 组件)
应用场景B2C 服务(如 Chatbot)、单一功能工具B2B 全企业转型(如多部门协同、企业级效率提升)
关键局限结构性 “幻觉”、黑箱不可审计、适配性差开发复杂度高、需长期实践验证
代表案例LLM 服务商(如 GPT-5 API)、高频算法交易系统SciTheWorld 的 Fractal/AlphaDynamics 平台、国家级 Extreme-Efficient Nations

三、AI 项目失败的四大核心原因

  1. 企业非算法生态

    多数企业是技术与运营老系统的堆叠,而非算法原生架构,模型难以无缝集成;

  2. 供需双方未就绪

    供应商 重新外包装现有产品,缺乏真才实学;采购方 RFQ 要求披露核心 IP,排斥创新方案;

  3. 人才角色错配

    混淆 “催化者(Catalyzer,驱动转型)” 与 “审计者(Auditor,监督观察)”,导致转型停滞;

  4. 概念混淆

    将 Science Applied(模型部署)等同于 Applied Science(算法化系统),忽视业务规则与启发式的整合。

四、M2 的十年实践历程(关键数字)

阶段时间跨度核心动作关键成果
种子阶段2015-2018以算法交易为 M1,构建高复杂度交易与风控系统匹配并超越行业顶尖水平,获 2016 欧洲最佳交易平台奖
探索阶段2018-2022拒绝过早商业化,抽象 M1 为 M2 架构,扩展至全企业部门提出 Data MAPs 框架,构建 The Cube 多维应用案例库
落地阶段2022-202318 个月内完成多部门技术部署,兼容 legacy ERP实现边缘计算部署,支持员工笔记本端智能体运行
验证阶段2023-2025内部迭代优化,推向市场验证获 CogX “最佳模拟创新奖” 等多项行业认可,估值达独角兽级别(4.5 人核心团队)

五、未来规划(双十年蓝图)

  1. 近十年(2025-2035)
  • 产品 / 部门 / 企业:扩展 Algorithmization 应用案例,与咨询公司合作规模化;
  • 集团 / 行业:推动跨企业联邦协同,构建行业级 Corporate AGI(CAGI);
  • 国家 / 社会:推进 Extreme-Efficient Nations 项目,探索 “正交艺术” 科普 Agentic AI;
  • 资本布局:成立基于 M2 的投资基金,覆盖公开市场与私募股权。
  1. 远十年(2035-2045)
  • 核心目标:将微观经济学理论(边际效用、偏好发现等)算法化,落地为生产级架构;
  • 合作模式:联合投资者或合资伙伴,避免早期 bootstrapped 模式的局限。

六 关键问题Q&A

问题 1:本文提出的 M1/M2 机器理论的核心创新是什么?它如何重构 Agentic AI 的发展逻辑?
  • 答:核心创新是将机器学习拆解为 “学习(L)” 与 “机器(M)” 两个独立维度,并进一步将 “机器(M)” 分为 M1 和 M2:M1 聚焦模型的校准、训练与部署(Science Applied),解决 “如何生产模型”;M2 聚焦企业级算法生态构建(Applied Science),解决 “如何高效消费模型”。该理论重构了 Agentic AI 的发展逻辑:打破行业对 “模型先进性(L)” 的过度迷信,指出竞争优势源于 “机器(M)” 的架构能力,而非模型本身(L 已因学术开源成为商品);明确 LLM 主导的 Agentic AI(M1 范畴)因结构性 “幻觉” 和黑箱特性,仅适用于 B2C 场景,而生产级 B2B 转型必须依赖 M2(Strategies-based Agentic AI)的联邦式、模块化、可审计架构。
问题 2:文档指出 95% AI 项目失败,其核心根源是什么?如何通过 M2 架构解决这些问题?
  • 答:核心根源是概念混淆与结构性错配,具体包括四类:企业非算法原生架构、供需双方未就绪、人才角色错配、Science Applied 与 Applied Science 混淆。M2 架构的解决路径如下:① 算法化(Algorithmization)重构企业架构,使模型与业务流程原生融合;② 联邦式设计兼容 legacy 系统,降低部署门槛,解决供需方适配问题;③ 明确 “催化者 / 冠军 / 审计者” 的角色分工,避免人才错配;④ 以 “模型(L)+ 启发式 + 业务规则” 的算法整合,真正落地 Applied Science,而非停留在模型部署(Science Applied)层面。
问题 3:本文中 M2 架构的实践验证有哪些关键成果?其未来规划如何体现 “从企业到社会” 的转型野心?
  • 答:M2 的实践关键成果包括:① 技术验证:10 年从算法交易 M1 迭代至全企业 M2,18 个月完成多部门部署,支持边缘计算;② 行业认可:获 CogX、银行技术奖等多项荣誉,西班牙央行审计其高效性;③ 商业价值:估值达独角兽级别,仅 4.5 人核心团队实现规模化。未来规划的转型野心体现在层级递进的落地路径:从产品 / 部门级应用,到集团 / 行业级协同,再到国家级效率提升(Extreme-Efficient Nations),最终延伸至社会层面(正交艺术科普、微观经济学算法化),核心是将 Agentic AI 从 “工具级自动化” 升级为 “组织 / 社会级结构性转型引擎”。

七 M1/M2 关键特性对比表实践路线图

1、M1/M2 关键特性对比表

对比维度M1(第一机器)M2(第二机器)
核心定位Science Applied(模型的工程化校准与部署)Applied Science(企业级算法生态构建与运营)
本质属性模型生产端(生成统计模型 f(⋅))模型消费端(整合模型与业务的算法化系统)
技术焦点数据工程、硬件管理、模型训练 /serving联邦式架构、模块化智能体、跨部门协同、合规设计
核心组件GPU 集群、分布式训练框架、API 接口MAUs(最小架构单元)、MAEs(架构扩展)、MAPs(架构模式)、Fractal/AlphaDynamics 平台
数据处理公开互联网数据 / 会话数据,侧重格式转换(令牌化、嵌入)多源异构数据(业务 / 合规 / 安全),侧重融合与治理
部署模式集中式(单服务器 / 云集群)联邦式(分布式节点,支持边缘计算)
合规性黑箱操作,审计困难设计即合规(透明、可追溯、可审计)
代表案例LLM 服务商(GPT-4 API)、高频算法交易系统SciTheWorld 的 M2 平台、Extreme-Efficient Nations 国家级项目
局限性结构性幻觉(LLM)、适配性差、部署成本高开发复杂度高、需长期实践验证、人才门槛高
竞争优势来源计算资源、模型调优效率架构设计、业务适配性、生态协同能力
核心目标高效生成可用模型实现企业 / 组织的结构性效率提升与战略差异化

2、Algorithmization 实践路线图(分层递进式)

核心逻辑:从 “技术验证” 到 “社会影响”,按 “产品→部门→公司→行业→国家→社会” 层级扩散,每个阶段均以 “技术落地 + 工业验证” 为核心准则。
阶段核心阶段细分时间节点核心动作关键成果
1. 种子奠基阶段Pre-CoE(预卓越中心)2012-2015- 以算法交易为 M1 切入点,构建低延迟交易与风控系统;- 提出 Avatar Calibration(增强机器框架);- 发布《Trading 2.0: Learning-Adaptive Machines》- 获 2016 欧洲最佳交易平台奖;- 推动 BBVA 成立全球首个跨资产类别算法交易部门;- 奠定 M1 技术基础
2. 架构抽象阶段Post-CoE(卓越中心期)2015-2022- 拒绝过早商业化,聚焦 M2 架构 generalization;- 构建 Data MAPs 框架与 The Cube 多维案例库;- 抽象算法交易能力至全企业部门(HR / 采购 /cybersecurity)- 突破技术定制化与互操作性矛盾;- 形成 “最小架构单元”(MAUs/MAEs/MAPs)核心组件;- 完成 M2 架构理论验证
3. 落地验证阶段工业级部署与迭代2022-2025- 18 个月内完成多部门 M2 部署,兼容 legacy ERP;- 以 Time-to-Production(TTP)为核心 KPI;- 内部迭代优化,实现边缘计算部署(员工笔记本端智能体)- 西班牙央行审计认可技术可行性;- 获 CogX “最佳模拟创新奖” 等多项行业奖项;- 公司估值达独角兽级别(4.5 人核心团队)
4. 规模化扩展阶段行业 / 国家级应用2025-2035- 与咨询公司合作,规模化推广 Strategies-based M2;- 构建行业级 Corporate AGI(CAGI);- 推进 “Extreme-Efficient Nations” 国家级项目;- 成立基于 M2 的投资基金- 实现跨企业生态协同;- 西班牙财政部牵头落地国家级经济政策;- 解锁金融 /cybersecurity 等行业的算法化转型
5. 社会价值阶段跨领域生态与文化2035-2045- operationalize 微观经济学理论(边际效用 / 偏好发现);- 推广 “正交艺术”,科普 AI 核心原理;- 颠覆企业银行业务模式,重构金融服务交付- 实现 B2C 场景的算法化渗透;- 建立 AI 与社会的良性互动;- 完成从 “技术工具” 到 “社会基础设施” 的转型

以下为研究正文

Advances in Agentic AI: Back to the Future

智能人工智能的进展:回到未来

塞尔吉奥·阿尔瓦雷斯-泰莱纳、玛塔·迪埃斯-费尔南德斯。

摘要— 鉴于最近智能体(Agent AI )和我们所研究的算法领域之间的融合,本文旨在恢复概念上的清晰度,并为日益分裂的讨论提供一个结构化的分析框架。首先,(a)它审视当下的格局,并对涉及的关键概念进行精确定义,涵盖从智能到智能体(Agent AI )的范围。其次,(b)它回顾我们之前的工作,对过去十年中发展的方法和技术进步进行情境化,突出它们的相互依存性和累积轨迹。第三,(c)通过将机器和学习的努力区分在机器学习领域内,引入了第一台在机器学习中的机器(M1),作为当今基于LLM的Agent AI 的基础平台,概念化为B2C信息检索用户体验的延伸,现在被重新定位为B2B转型。在此区分的基础上,(e)白皮书发展了第二台在机器学习中的机器(M2)的概念,作为全面的,生产级B2B转型的架构先决条件,将其描述为基于策略的Agent AI,并将其定义基于这些系统必须克服的结构性准入障碍,以确保操作上的可行性。此外,(f)它提供了对似乎是第一个完全实现的M2 的概念和技术洞察。最后,借鉴在开发算法化基础架构方面的前两个十年的专业和学术经验所展示出的准确性,(g)它概述了未来两个十年的研究和转型议程。

  1. 简介
    =====

1.1. 背景

**人工智能已成为全球技术话语中的主导主题。到2025年初,它已渗透进董事会会议室、咨询框架、国家数字战略和公众想象。**然而,尽管这一术语迅速兴起,但其使用却不一致且常常不够精确——常被归结为大型语言模型(LLMs)方法论。这种普遍的误解掩盖了智能系统在架构和战略上的真实影响,导致企业、政府和学术机构将期望锚定在那些从未为生产级转型设计的技术上。

这一差距在2025年9月变得特别明显,当[21]披露了一个关键的见解:通常所称的“幻觉”现象并非偶发缺陷,而是LLM的结构特性。这些模型产生的错误直接源于它们的统计估计过程,而非检索失效。因此,许多公司准备将基于LLM的主体AI集成到他们的运营基础设施中- 通常是通过表面或“氛围驱动”的开发方法- 实际上是将结构性噪音嵌入到他们的生产系统中。这为现有的运营脆弱性和网络安全风险增加了一类新的风险,使得对这些战略计划进行彻底重新评估变得迫切。

重要的是,这一结论对我们的读者来说并不新鲜。在我们2023年9月的出版物[9]中,我们明确论证了“大型语言模型中没有幻觉…但设计上有错误“,因为大型语言模型不检索信息,而是估计和组合信息。因此,LLM错误的结构性质是可预测的——并且早在最近机构承认之前就已经明确表达出来。

这些问题只是更深层次误解和方法论不一致的表面现象- 这些不一致性被一些一流咨询公司和主要技术提供商进一步放大。那么,为什么这些持续存在的错误判断会在如此有影响力的机构中继续出现?尽管本文的后续部分将剖析我们认为是真正存在的“大象在屋子里”,但核心解释可以简洁总结为:目前的技术格局仍处于经济失调状态,受到供给方(技术销售商)和需求方(企业买家)普遍缺乏判断力的驱使。正如我们将展示的那样,这种失调的持续不仅可以理解,而且结构上嵌入在该领域的激励机制和知识约束中。

考虑到社会利益的重要性- 从错误巨额投资到不必要的大规模裁员- 对于概念的准确性和架构的清晰性的需求是迫切的。

因此,我们的目标是双重的:

首先,阐明当前围绕智能体(Agentic AI)存在误解的根源和驱动因素;

其次,澄清前进的道路,以便科学家、管理人员、政策制定者和从业者能够更有效、更负责地参与塑造这种技术转变。通过这样做,我们希望为组织提供判断力和工具,以准确、负责任和高效地引导向智能体(Agentic AI)的转变。

1.2 贡献摘要

本文认为,混淆的根源在于未能区分机器(M:machine)学习(L:Learning)的两个基本组成部分- 学习(L)和机器(M)学习组件由计算统计学和传统统计学定义,基本上是一项科学努力,其**产出模型f(·)**由于学术创新的全球和开放性而成为商品。竞争优势无法在模型层面(L)持续存在。相反,它必须起源于机器:控制模型如何部署、编排、与启发式结合以及适应实际运营的架构和算法基础设施。这就是为什么授权AI,一种创建软件架构的新方式,已经成为成功计划的基石- 更加定制和专有,以此来保持企业竞争优势。

为了明确这种区别,我们引入了智能体AI的机器理论,进一步区分了两种机器。 M1指的是科学和数据工程融合,用于估计芯片密集型模型(比如校准LLM所需的模型)

M2在M1的基础上增加了许多功能,用于创建一个联邦、模块化、算法生态系统,通过这个生态系统,组织可以在部门、流程和基础设施之间实现智能操作。M2明显比M1复杂得多(它可以为不同目的创建M1),我们认为这是企业最终追寻的技术。

在M2中,我们区分两种方法:基于LLM的方法和基于策略的方法。基于LLM的M2是指在智能体人工智能中的当前主流。这意味着,当M2旨在基于LLM的情感编码构建,以便由非编程人员创建软件并自动部署到生产环境。需要注意的是,这是试图在以调整LLM为目的创建的M1的基础上构建M2。因此,受限于LLM提供商希望从面向零售的B2C服务转向面向企业的B2B服务的关键策略。然而,正如一些CTO所指出的,这种轨迹引发了对营销叙事程度对预期塑造的担忧,而非技术可行性。LLM的结构特性- 幻觉、不透明性、有限的确定性- 对其支持生产级M2架构的能力施加了固有的限制。

基于策略的M2是指原始的主体型AI来自[10]。它将M2概念化为一种自上而下的架构学科,根植于我们所知的最复杂的数字化业务:算法交易。正如[3]和更广泛的算法化系列(见下面的第2章)所详细描述的,这一观点建立在这样一个信念的基础上,即组织无法通过从最简单的用例逐步向上发展来扩展其技术能力。相反,正确的轨迹应该是相反的:从最具挑战性的运营和算法情境开始,并将这些能力向下推广到所有业务功能中。

图1-机器学习的组成部分:对其本质的巧妙概述。

这项工作本质上是跨学科的,融合了经济学、技术和机器学习,以制定一个关于转型的连贯理论,该理论在商业发展方面具有现实意义。

我们总结认为,企业、国防和国家转型的未来,将不依赖于统计模型的复杂性,而在于掌握基于战略的M2:将启发式、模型、数据流、合规约束和联邦计算单元结合成动态、有弹性、自我编排的架构。从这个意义上说,智能体人工智能不是大型语言模型(LLM)现象,而是一台更复杂的机器,理解了一种新的组织范式——一种要求清晰、严谨和深思熟虑设计的机器。

1.3 范围和限制

这篇论文的范围故意集中在我们过去十年来发展中的应用科学领域,这一领域之所以没有得到精确定义,是因为它处于学术严谨和工业执行的交叉点。因此,即使是其传播方式- 词汇、结构和概念框架- 也必须偏离已建立的学术或企业惯例。应用科学在本质上是具有颠覆性的:它将科学理论与专家启发式、战略推理与操作部署,以及多种统计模型与特定领域判断相结合,以产生既具有影响力又可实施的解决方案。

关键是,这种整合并没有侵蚀它所绘制的领域。它保留了科学基础的完整性,即应用科学- ML 中的L 的创造,以及M1中体现的工程和计算挑战,以及由M2 实例化的应用科学固有的领域专业知识,其中包括商业策略,监管限制,运营设计,网络安全等等。通过这样做,该论文保留了清晰的概念界限,使每个领域都能以适当的深度和独立性讨论,同时仍有助于形成一个连贯的整体框架。

作为结果,这篇论文占据了一个基本上非典型的空间:它既不符合学术研究的风格或方法标准,也不遵循行业白皮书的惯例。它旨在阐明一门既桥接两个世界又不完全受限于任何一方的学科。

此外,本文件故意包含比以往任何一份出版物更多的商业见解。请注意,我们不认为这些面向商业的考虑在学术上是优雅的。

这种挑战也受到这些系统专有和高度定制化性质的影响,这就排除了标准化的定量性能比较的可能性。正如我们将解释的那样,这样的比较无法有意义地构建,也不能被负责任地披露- 无论是我们还是其他在这个领域操作的参与者。

然而,对于追求颠覆性创新的新兴研究团体来说,无论是在这一领域还是在相邻领域,都至关重要获得对参与其中的实际现实的清晰和未经过滤的理解,包括开始这样的探索所固有的优势和结构性挑战。只有透明度达到这一水平,未来的研究者才能校准他们的期望,适当评估风险,并为定义应用科学规模的跨学科要求做好准备。

这些信息的整合本身就像是一个实验。鉴于涉及的主题涵盖了广度和深度,我们故意构建了材料,以便读者可以通过LLM与之互动从中受益。 当主题涵盖多个学科并超出个人专业领域时,这些工具可以帮助建立连接,澄清依赖关系,并更有效地导航概念结构。 我们发现,当被广泛使用的LLM们被要求批评这份文件时,他们往往忽视了我们的主张是基于先前论文中已描述的结果(例如,我们已经证明了公司规模的可扩展性以及机构层面的新型合作伙伴关系)。 如下一章中详细描述的那样,这些陈述得到了广泛和多样化的先前工作的支持,因此可以通过明确上传构建基础论文集合来消除。此外,在回应大多数批评时,这些系统经常会纳入在建立初始批评时被省略或忽视的信息,从而暗示原始评估的不完整性。

正如我们将讨论的那样,本文描述的技术不能直接由开源社区进行验证,因为其开发和评估需要大量的财政、计算和组织投资,因此仍然是专有的。然而,在算法化框架内阐明的基本原理和方法论基础在科学意义上是完全可复制的。独立的研究小组可以通过重建类似系统来复制和扩展这些结果,就像算法交易通过基于一套共享的理论和经验文献的累积进展而出现和成熟一样。

算法化的可扩展性受到专业服务的广度和强度的内在限制- 即顾问在此描述的M2 平台之上提供的战略咨询和数据科学服务。因此,本工作有意将其范围限制在M2 层本身,该层构成了算法化可以在全球范围内扩展的主要机制,独立于人力服务瓶颈。

详细讨论基础技术、方法论和实施技术超出了本范围。 寻求更深入技术洞察的读者可以参考我们更广泛的算法化语料库,总结在文献回顾部分,这些基础知识被全面发展。

1.4 结论

有意义、可扩展和具有弹性的转型是一个机器问题,而不是一个学习问题。正确理解的智能体AI不是LLM动态的延伸,而是操作智能- 无论是人类还是机器- 跨越整个组织、部门和国家所需的架构纪律。只有通过掌握基于策略的M2,机构才能从表面数字化过渡到真正的竞争力和结构效率。

**换句话说,没有任何组织能够有效地处理人工智能,除非它首先对自身进行转型。**人工智能的采用预设着一个操作模型、架构和治理框架,能够将其整合在一起。正如我们将展示的,组织转型和人工智能整合并不一定需要按顺序进行。当设计正确时,它们可以并行发展,避免因将它们视为孤立的、连续的阶段而导致的动力流失。

  1. 文献综述
    =======

我们的文献与我们对超级高效转化的理解同步发展,这一范式同时借鉴了最小公约数原则和分形形式的原则。其核心问题在于:如何能够用最少数量的建筑组件实现最广泛的功能广度,并支持一个严谨而可推广的方法?

因此,我们的路线图遵循逐步和分级的进展,反映了转变本身的自然扩展:

l产品

l部门

l公司

l行业领域

l国家

l社会。

我们的首要任务是建立一个全新学科的整体框架-这需要进行颠覆性创新而不是渐进式创新。渐进式进步是不够的:我们的雄心不在于完善现有的方法论,而是重新定义应该构建在其基础上的转变的架构、概念和运营基础。然而,颠覆性创新在工业和学术界都很难获得资金支持。所需智力和技术飞跃的规模要求承诺程度很少受到传统研究资助、公司预算或风险投资时间表支持。

此外,我们意识到制约我们的同样的市场准入壁垒也将阻止他人进入;除非有人愿意承担建立该行业所需的全部专业风险,否则这一学科将无法实现。换句话说,它的先驱者将不得不面对远远超出传统研究范围的障碍。

我们研究质量承诺的一个关键原则是,总体上,白皮书只有在基础技术在工业中首次构建并经过验证后才会被发布。我们认为这种顺序对于防止读者期望不一致是至关重要的。

此外,我们的长期目标要求我们的研究论文保持有机一致性,但最大程度上正交。就像我们在行业中避免两次销售同一产品一样- 故意寻求新项目,使自己暴露于新的约束和设计挑战中- 我们也避免了渐进的学术更新。

以上一切使我们赢得了众多一线机构的信任,进而使我们得以启动整个卓越中心(CoE) - 我们认为这在应用科学领域的工作中至关重要,同行评议的概念延伸至广泛且异质的一系列学术和市场参与者,这构成了我们工作的可信性和相关性的另一个肯定。

应用科学,算法化的整体文献框架使我们期望未来能够自然而然地出现增量创新,特别是通过与学术合作伙伴的合作。

2.1 产品

我们创建的产品是通过基于SaaS框架设计的。因为我们的目标是开发一个以人工智能为先导,全方位的企业软件平台- 在组织内外都灵活、联邦式,并能不断改进- 所以我们需要在概念进入主流讨论并在更广泛的“软件即服务”标签下普及之前,就已经利用了定制的SaaS近九年(这仍然是行业面临的挑战)。

2.1.1 Pre-CoE

在卓越中心成立之前,我们有先前的工作,尽管并非在定制SaaS范式内构思,但对随后的技术发展轨迹非常相关。

在[14]中,引入了一组解决方案,即使按照当代标准来看仍然先进。

它介绍了一种算法方法论,挑战了传统的微观经济学原理,即在完全竞争条件下,均衡价格会趋于边际成本。通过专注于一种全新的数字原生产品- 股票指数期货- 博士论文证明了可以设计出新颖的定价机制,以实现比古典理论所隐含的更深层次的(统计)效率。通过这样做,它展示了当市场足够数字化时,新的算法结构可以转移可达到的效率前沿,揭示了在标准微观经济框架中以前无法访问的定价动态- 尤其是完全复制对冲。

该论文还揭示了学术发展和商业影响之间的分歧。当时,学术研究越来越倾向于优雅地结合方法论,而没有充分强调领域专业知识。通过专家见解重新构建对一个众所周知的交易问题的解决方案,该论文能够用更灵活的方法胜过当前的学术艺术建模水平。这标志着我们将“科学应用”与“应用科学”区分开来的开始,这一区分我们将在下面详细阐述。

最后,它介绍了Avatar校准,据我们所知,这是对增强式机器框架在该领域应用的第一个示例- 这是我们稍后将回顾的一个主题。

重要的一点是要注意到,《14》的早期书籍版本于2012年发布(参见[15])。由于博士论文提前完成,并等待数年后进行答辩,因此有一种愿望将其结果迅速提供给行业。该书最终被所有一流美国投资银行和一些领先的对冲基金传阅。其标题为《交易》。

2.0:《学习自适应机器》已经暗示了我们赋予机器学习中机器的不断增长的重要性,预示着后来将顶点于算法化计划的调查方向。

工业上,这篇论文促使了BBVA公司创立了一个新部门- 据我们所知,这是全球首个集中和算法管理所有资产类别策略的卖方部门。这项工作也为随后获得欧洲银行技术奖(2016年)的最佳交易平台奠定了基础,从而证明了底层方法论的实用性和行业级的稳健性。

2.1.2 后续企业

数据映射,如[10]所阐述的,成为算法化框架的基石。我们的意图是首先撰写一篇深入、概念密集的论文-一个并非易于跟随的论文-以便后续工作可以引用它,同时提供更易理解的叙事。该论文提出了一种根本上新的技术创建方式-精确地如下所述的基于M2战略的主动型AI方法-并试图证明其普遍适用性。

在当时,几乎所有来自顾问、大型科技公司、风险投资者或公司(唯一例外是学术界)的外部反馈都表示怀疑,认为单一的架构范式无法成为任何公司的主干。人们普遍期望的是基于同样狭窄技术构建的产品,这与下文描述的M1的性质相一致。没有人尝试过,更别提证明,一个更雄心勃勃且可泛化的方法。

作为回应,我们构建了一个多维框架“立方体”,其中填充了跨越各行业、组织规模和数字化成熟度水平交付产品的具体示例,并注释了各自的技术成熟度水平(TRL)。只有在我们相信“立方体”已经充分填充以证明体系架构的普适性和可扩展性之后,我们才发布了白皮书。

愿景是雄心勃勃的:现成的技术必然会产生过于复杂的堆栈,导致组织只具有较弱的玩下去的权利,而非强劲的赢得的权利。相反,我们设想一个世界,在这个世界中,技术不仅仅是被组装而已,而是被精心打造- 一个公司超越通用、商品化工具,构建精益、智能和战略上一致的基础设施的世界。通过专有的架构设计和故意的差异化,这样的公司将加强他们赢得的权利,确保通过标准化技术产品无法达到的竞争地位。

结果是令人兴奋的:我们找到了一种方法- 可以说是突破性的- 来扩展技术定制化,保持在魔方的所有维度上完全互操作。这一突破开启了一个广泛的新颖- 以及以前难以想象的- 可能性范围。最显著的是,它实现了构建超精简、完全专有的技术基础设施,可以在最小人力开销的情况下部署,同时与那些拥有数亿预算运行基础设施的上市公司的端到端堆栈保持竞争力。关键是,这种方法将价值中心从依赖相同的现成软件堆栈所带来的玩的权利,重新定位到来源于专有的架构设计和战略差异化的赢的权利,就像在算法交易中观察到的那样。

鉴于其破坏性本质与通常受到索引学术期刊青睐的渐进式创新相悖,并且考虑到对SciTheWorld作为一个运作实体进行了广泛讨论,我们预期SSRN验证人员会将该手稿解释为自我推广,而不是工业规模实验的文档,因此拒绝了它- 最终发生了这种情况。这一结果与人类评估过程中广泛记录的认知和制度偏见一致,包括激励不一致、新颖性厌恶和声誉风险管理。但在学术转型中,这也是公平的,正如产业转型中出于各种原因存在的变革抵抗一样。

值得注意的是,我们假设在受控条件下,大型语言模型(LLMs)可能比人类评估者更容易接受真正的新构思。无论如何,我们可以将文件删减到第6章的“机器理论的自主人工智能”部分,以确保符合要求,或者写一本书代替- 这两种选择都是我们未来可能考虑的有效选择。

Fig2-基础贡献的亮点:推动产品发展的CoE前后论文。

2.2 部门

一旦部门内的多个产品得到转变,就有可能重塑部门本身的运营逻辑。我们的经验表明,许多业务低效率源于从前一代智能体或甚至是学术规定那里继承下来的工作流程,这些流程是为了适应过时技术的限制而设计的。随着这些技术早已过时,许多部门现在的运作低于其潜力,留下了大量未开发的价值。

[10]文件记录了多个情况,在这些情况下,一旦基础产品通过算法架构重建,部门转型就会自然而然地出现。

更重要的是,数据MAPs范式使得以往不可能的跨部门工作流程成为可能。例如,在[4]中探讨的一些例子,特别是跨通信和CFO职能以减轻股市和社交媒体操纵风险,以及在[11]中,通过协同网络安全、业务运营和合规职能来启动更高效的预算编制和监督流程。

从工业角度来看,我们目前正在支持从大约50名员工到超过10,000名员工的组织进行转型,主要通过跨部门干预的战略性排序。通常从涵盖最完整一套挑战的领域开始,然后让其他领域以联邦化方式继承和发展。

正如在第6章中所明确规定的,这个转换过程包括三种不同类别的服务,每种都具有根本不同的可伸缩性特性。

首先,战略咨询侧重于确定跨组织转型倡议的最佳优先级和顺序。这种活动本质上是不可扩展的,因为它依赖于高上下文判断、领域特定性和与高级管理层的密切互动。此外,从公司的角度来看,让单一提供者垄断这种战略指导既不可取也不高效;战略观点的多元化对于避免锁定、认知偏见和路径依赖至关重要。因此,我们的框架明确留出空间,让独立的战略咨询机构承担这一责任。

其次,数据科学咨询通常在商业意图和科学形式化之间运作,在将战略目标转化为应用模型、数据管道和实验验证方面起到枢纽作用。类似于战略咨询,这一活动在结构上并不具备扩展性,因为它依赖于定制问题的形成、迭代探索和专业知识。再次,对客户而言,跨供应商的多样化对于减轻模型风险和避免方法论单一文化是有益的。因此,我们有意将这一功能定位在可扩展核心范围之外。

第三,定制SaaS交付将前述层次的成果整合为生产级系统,将应用科学嵌入常规业务操作。与以往的服务不同,这一层本质上具有可伸缩性:一旦底层架构、协议和治理机制建立起来,它们可以在组织之间部署、维护和升级,且边际成本有限。这一角色类似于历史上表格软件的扩展,比如Excel,它使员工和顾问都能通过公式和脚本(例如Visual Basic)操作复杂的逻辑。因此,我们承担这可伸缩层的责任,包括长期维护、升级、访问控制和权限策略。

2.3 公司

一旦足够多的部门进行了转型,整个组织将会发生根本性的变化。部门算法化的累积效应不仅仅改善孤立的工作流程;它重新配置了公司的运营结构,实现了之前无法实现的协调、效率和战略连贯性形式。

在这个转变的早期阶段,许多公司对他们内部开发必要技术和算法能力的乐观表达了乐观情绪。在交易行业中曾出现过类似的模式,量化研究人员最初试图自行构建端到端的解决方案。最近,数据科学家在公司环境中采取了类似的立场。随后的动态是,高管最终决定停止内部努力,转而招募外部技术提供商或高度专业化的人才,这与二十年前在金融市场中观察到的轨迹相似。论文[9]详细展示了这些动态的部分,在风险-回报框架下。

图3:[9]中的高级管理层决策框架。

然而,正如各行各业的经验所表明的那样,这种深度的转型是非常复杂的,关键挑战在于细节。只有极少数个人或团队具备跨学科掌握的能力,才能成功地设计和执行这样的转型。这个现实与对冲基金行业中观察到的能力集中一致,而且最近还出现了像Meta这样的公司提供超过十亿美元的薪酬计划— 这进一步证明了精英算法和架构人才的稀缺性和战略价值。正如我们将要展示的那样,这些类型的提供与机器学习框架中M1架构逻辑的项目管理相对应。

一旦人才和供应商被正确选择,[12]、[4]和[13]中开发的框架为控制算法化过程提供了结构化的管理基础,最终引导组织进化为一个完全基于平台的企业。我们开发这些框架来管理卓越中心本身,确保其运作始终以控制、合规和架构连贯性原则为基础。

这些作品介绍了三层公司模型,区分如下:

1.M2(支持联合、基于策略的智能体人工智能的架构层),

2.保留游戏权需要的转变,和

3.保护- 甚至扩展- 胜利权所需的转变。

该框架在私募股权投资组合管理领域进一步展示了其相关性。其贡献不仅限于单个公司的转型:它展示了组合公司之间的本地互联性如何可以创造生态系统级别的协同效应,为私募股权开启新的战略叙事。这在国防等领域尤为重要,协调的算法基础设施可以释放出大量跨公司价值。我们将继续为这一努力付出重大研究工作。

符合将公司融入统一生态系统概念的最极端形式- 全垂直整合- 在[3] 中得到探讨。然而,该文中所发展的框架与传统微观经济理论有明显不同。该文并非通过输入-输出关系来定义垂直性,而是通过核心技术等级制度来概念化它。在这种观点下,拥有最高技术复杂度的企业成为所有其他企业的自然整合者- 我们称之为自上而下的垂直整合方法。

这个观点也解释了为什么在我们看来,许多新型数字银行仍然远未做到高效,并且在本质上与传统机构没有实质性区别。它们的区别通常仅仅在于使用现代编程语言而不是COBOL - 在传统金融中不可避免地是一种负担- 而不在于拥有能够转变其胜任权的基本上优越的技术架构。

最后,在[2]中,我们探讨了人工通用智能(AGI)的话题,这个概念最近在商业叙事中受到了明显的扭曲。我们认为,人类离工程化任何类似于人类智能水平的系统仍然遥远-特别是考虑到我们在第3.2节中智能的操作定义以及人脑仍然非凡的能源效率。

图4:AGI对LLMs与企业算法化和增强机器的基本原理的示意图见[2]。

然而,我们提出一个根本不同的观点,区分**人类通用人工智能(Human AGI)和企业通用人工智能(Corporate AGI,CAGI)。后者是合成的设计,**不受生物类比的限制,其早期基础已经可以表达。CAGI构成了一个创新的全新领域,能够实现大规模全球效率的提升,因为其结构允许系统、企业和行业之间的本地互连,这一想法最初在[10]中首次被预见,特别是与区块链结构形成鲜明对比。

图5:智能体智能人工智能领域的示意图,如[2]中介绍的人工窄智能。

图6:来自[10]的区块链与MAPs的比较数据。

公司的投资组合,以及由众多子公司组成的大型企业集团,拥有重复的部门结构和重复的技术,将从他们自己的CAGI的出现中获益更多。关键是,这些收益并不需要跨单位集中战略决策。相反,它们来自于允许每个实体保留自治权,同时在一个联邦创新架构中运作,实现协调而不强迫统一。

2.4 部门

当您改变同一行业的几家公司时,您就改变了这个行业。

这基本上是以上所用的相同思维方式。然而,在我们的CoE在十年内实现这个目标并不容易。因此,我们不得不使用我们经过测试的技术来证明我们的理论- 使用案例仅限于我们自己的使用,而不是与许多公司合作,这样可以使影响在整个行业中普遍化。

特别是,我们提出了现智能体论,针对投资和网络安全等领域,作为研究人员构建新视角的基础,当然,这需要与以往的方法进行最佳结合。

2.4.1 投资

**在向一家大型资产管理公司部署M2时,我们系统地挑战了几项长期存在的方法论约定。**许多这些做法- 尽管很常见- 被证明是低效或在概念上存在缺陷,主要是因为它们受到过去技术限制的影响。这促使我们撰写了一系列关于技术现代化投资组合管理的论文三部曲。我们的工作主要关注了三个主要领域。

在[6]中,我们认为将投资组合内的仓位进行汇总以进行风险管理的广泛实践并不是一种最佳设计选择,而是早期技术时代的遗留约束。从历史上看,由于投资者缺乏管理产生单个交易的各个基础策略的能力,他们被迫依赖于仪器或投资组合水平的汇总KPI。这隐含地假定金融工具足够可替代以证明其可以进行汇总。

我们认为,只有当工具在更广泛的维度上相似于它们的基本金融特性时,才具有这种可替代性- 具体而言,它们必须共享激发它们纳入的战略基础(例如,一个工具是否充当另一个工具的替代品)。为了解决这一结构性限制,我们引入了基于维度驱动的投资组合(DDP):围绕战略维度而非工具的投资组合构建和风险控制的重新构思。这种方法提出了一种算法原生的投资组合设计架构,实现了对风险和绩效更精确、更细粒度、更可解释的管理。

在[7]中,我们引入了一个新的投资组合管理框架,使投资者能够通过以下方式解释和控制他们的敞口:

1.传统的参考基准(Beta);

2.一个增强版的基准(Alpha-1),旨在无缝整合到统计套利生态系统中,以便通过设计利用该理论的全部内容;和

3.一组免费策略,包括任何专有交易活动,直至包括算法市场做市(Alpha-2)。

在这种框架下,资产管理公司、投资银行和对冲基金通过在这三个组成部分之间分配风险偏好来区分彼此,而不是通过不兼容的方法论。相同的基础技术和方法架构适用于所有类型的机构。这种共同结构不仅提高了资产管理公司控制总体风险和澄清绩效归因的能力,还增强了公司其他关键维度,比如其吸引和留住人才的能力- 尤其是那些更倾向于算法方法而不是传统金融的人。

在[8]中,我们通过展示组织如何利用投资组合经理的专业知识,使其摆脱运营负担,从而能够更多时间用于研究和战略发展,并实现更加协调的工作。这种方法使我们在2012年引入的"增强机器"概念得以实现(参见[15]):新角色应包括人类智慧引导和监督机器,而机器则自主地承担规模化和操作密集型、日益复杂的任务。

2.4.2 网络安全

卓越中心最初开展的项目集中在先进的网络安全领域,这一选择在两个明显的方面具有战略意义。首先,我们有意选择了一个远离金融领域的领域,以避免被定型为纯粹的金融科技倡议。尽管联合创始人们在金融领域有着突出的职业生涯,依赖这一遗产将是最便捷的路径,但并不是旨在转变多个领域的学科的最佳基础。其次,从网络安全开始确保了技术在构建时拥有最大的网络安全灵活性,迫使我们去获取深入的领域知识,以真正提供正交价值。

当Algorithmization开始获得更广泛的认可时,西班牙首席信息安全官协会(ISMS)邀请我们阐述我们对网络安全的看法,特别是考虑到基于策略的智能体所解锁的新能力范围。由此产生的[11]做出了几项贡献。它确定了必须由业务和网络安全团队共同考虑的新的高优先级风险;重新构建了网络安全资源配置,围绕业务、合规和安全功能的混合化展开;展示了算法本地化平台如何实现跨业务和网络安全流程的和谐编排;并建立了未来网络安全战略的蓝图,其中业务连续性和风险连续性通过战术技术紧密耦合。

2.5 国家们

一旦各行业规模化转型,就会出现整个国家转型的条件。

国家必须越来越将技术转型视为一项地缘战略资产。正如我们将讨论的那样,M1 主要关注人工智能的创造- 当今大多数地缘战略竞争目前的焦点所在。我们的工作转移了注意力到AI 的使用上,强调M2,其中行业竞争优势存在。这些优势不在统计模型(L)中,也不在生产它们的基础设施(M1)中,而在于有效消化AI 的架构能力。最近的全球商业经验证实了这一观点:消化AI - 在各行业、基础设施和机构中使其运作起来- 似乎是所有领域中最复杂且具有战略重要性的任务。

在考察国家影响时,我们专注于两个关键维度:

1.小说般的国防,通过传统战略思维尚未探索的方式进行;和

2.GDP增长,通过算法原生产业转型释放的结构性生产率提升。

2.5.1 新颖的防御

**西班牙武装部队找我们考虑为北约准备一份关于人工智能进展的论文。**我们选择了一个根本不同的想法,而不是跟随大多数贡献者探索的老路:一个国家可以在不发射一枪的情况下仅通过其董事会来接管另一个国家。

我们展示了如何利用我们的技术,一个复杂的攻击者可以组织协调的市场和社交媒体操纵。一个以黑客为基础的交易策略针对一家上市公司,可以执行一个高度校准的攻击,同时产生两个结果:首先,攻击者可以在财务上获利,将收益重新投资到随后更具野心的操作中;其次,通过积累足够大的头寸,攻击者可以获得一个董事席位,从而以与攻击国家利益一致的方式引导公司的战略方向。

我们进一步展示了如何利用能够协调公司内多个部门的技术,可以在社交媒体和金融市场上展开一项防御性反对策略。重要的是,我们设计这些对策,使其在监管机构应该能接受的情况下运作,将防御性行动与合规预期在系统化、透明、可追溯、可预先配置、可审计的背景下保持一致。

NATO最终没有接受这项提议,这一事实仍然令人担忧,特别是考虑到该文章现已公开,因此这一战略原则上可以被任何足够有能力的对手角色执行。

2.5.2 极高效国家

到了2024年末,随着人工智能日益成为地缘政治竞争的中心轴线,我们决定加快一篇原定于2020年代末发表的论文的出版。当时,美国和中国将大量战略努力集中在人工智能的创造上,主要通过模型开发和计算能力的提升来进行竞争。因此,在地缘政治紧张局势升级的时刻,有必要阐明一个同样重要的演化路径的存在:人工智能消费,即M2的领域。这篇论文是这一更广泛努力的一部分。

这个论点是双重的。首先,人工智能的消费代表着一个重要的经济价值来源,可以说比人工智能的创造本身更具盈利性和可扩展性。其次,这是一条仍然与美国和中国战略一致的道路:这些国家最终将成为美国和中国生产的人工智能技术的主要消费者。此外,被广泛引用的统计数据显示,95% 的人工智能项目失败(参见麻省理工学院的研究),这既说明了以人工智能创造为中心的地缘战略的局限性,也说明了全球对人工智能消费方面复杂能力的需要。在各国部署的M2 将以一种前所未见的方式造福世界。

我们意识到,随着时间的推移,要维持这样一个倡议将是具有挑战性的。参与机构人员的变动- 甚至是执政政党的转变- 对连续性构成了结构性风险。尽管如此,该倡议的战略相关性使其必须持久存在。正如[2]中所述,保持冷静、顺序和战略耐心可能是至关重要的。令人鼓舞的是,其他国家的兴趣表明了在全国范围内开展M2的更广泛国际努力的潜力。

2.6 社会

我们在[15]中反映了对社会产生更广泛影响的首次尝试。当我们加入伦敦大学学院的计算机科学系后(在此之前已经建立了专业生涯,尤其是在算法执行交易方面),我们意识到人类和机器之间的关系将出现重大转变。我们也担心这种转变会出现错误:从“全是人类而没有机器”的世界转变为“全是机器而没有人类”的世界。我们预料到,这种误解将被应用科学和科学应用之间的概念混淆所推动,这是我们稍后会详细阐述的区别。

在这种背景下,回顾2012年(参见[15]),据我们所知,我们引入了Avatar校准,这是到目前为止增强机器框架中最先进的实例。Avatar校准证明了一个人类专家可以在逐渐被机器主导的环境中保持有意义的角色,通过校准过程向机器证明,它的表现与有人类参与时相比有所提升。除了这一贡献,我们对应用科学中工具的流行使用感到不满。大多数金融研究采用强化学习,试图让机器自主学习交易的方法(往往是幼稚的),而我们提出了一个概念上的逆转:使用强化学习来理解交易算法的内部“大脑”,并根据交易员的“大脑”(专家的启发式)来指导其校准(一种正则化)。

我们最希望这段文字能在几个领域成为一个警钟,尤其是劳动经济学,因为我们预见到由于对人类和机器智能之间适当互动的误解而引发的广泛- 且不合理- 的裁员。有趣的是,这种担忧反映了今天正在发生的动态。

随着将应用科学与科学应用混为一谈的后果继续显现,我们在2023年发表了一篇文章,以澄清这种混淆的危险,特别是在转型的背景下。我们认为,人工智能项目失败的相当大比例是因为方法论是从科学中继承而来,而KPIs是按照商业标准来衡量的。

2.7 结论

与研究宏观水平创新后果的2025年诺贝尔奖获得者(莫基尔、阿吉昂和豪伊特)相比,算法化——源自于长达十年的学术理论和工业成果综合——提供了触发创新并在业务层级间传播的机制。他们的工作解释了技术进步如何塑造长期增长、生产率和创造性破坏,而算法化则着眼于必须为这些理论效果在实践中显现提供架构和操作化的技术。它解决了从创新作为抽象输入到创新作为可重复、高效、整体性组织过程之间的缺失环节。

通过将公司重新定义为一个联邦算法生态系统,算法化提供了一个框架,在这个框架下,效率、适应性和应用的科学推理能够在产品、部门、公司、行业、国家和社会之间一致地扩展。

在这个意义上,算法化并不仅仅描述技术的演变;它构成了一个应用科学的学科,将创新本身操作化。它将抽象模型转化为生产级的、联邦架构,能够不断演化— 从而解锁莫基尔、阿吉翁和豪威特宏观经济机制在现实世界中实际发挥作用的条件。因此,算法化可能成为下一个经济组织时代的基础支柱:在这个时代里,效率、互操作性和战略差异化的出现不是源自孤立的产品或模型,而是源自它们背后整个机器的紧密设计。

  1. 理论框架
    =======

人类需要清晰而准确的定义作为有意义的交流前提。如果没有这样的精确性,术语就会与潜在概念混淆。

这一章节突出了学术、社会和商业动态,我们认为已经造成了一场完美风暴- 一个极易产生概念效率低下、误解和普遍困惑的环境。

从学术语言动态和受尊重的人才学科,到在之前误导的基础上构建错误叙事,再到金融市场充当恢复对齐的平衡的对立力量,这一顺序阐明了一个机制,通过该机制系统最终可以收敛回均衡状态。

3.1. 当代学术语言中的意外营销偏离

学术界严格遵循精确的术语,直到术语导致复杂或笨拙的命名。为了促进交流,学者们有时会回到基础,并用更雄辩或修辞优美的标签来替换这些术语- 例如,在[14]中的Avatar校准。

简化的标签仅仅是为了学术方便而设置的,但当这些标签逃逸到更广泛的公共应用中时,就会产生困难。

当这种扩散规模化发生时- 正如在人工智能的情况下- 信息流甚至可以通过社交而非学术渠道传达给研究人员。这种研究人员-消费者的反转破坏了典型的知识等级结构,并引入了新形式的偏见和混乱。

效果在年轻观众中特别显著,他们构成了在一个编程和计算技能在国家和国际层面被战略推广的世界中,与人工智能互动增长最快的人群。当他们在社会混乱中被偏见地从一开始做为学者成长时,要从普遍的近视中逃脱变得特别困难。

3.2 术语:概念清晰度的上下文框架

在继续之前,建立定义是至关重要的,这样本文其余部分的论证才能被正确解释。

为了本文的目的,我们将人工智能(AI)定义为通过营销叙事补充的机器学习;迄今为止,没有任何现有算法以实质意义上的智能体现。

我们将智能定义为以精确度生成样本外异常值的能力。

相应地,我们将机器学习(ML)定义为计算统计的一个分支,从而概念上将其定位得比传统统计学更为接近。

在传统统计学和计算统计学中,模型通常采取y = f(x) + u 的形式,其中(y, x) 是观测数据,f(x) 是一个确定函数,u 是误差项。

x)代表数据点。通常,研究人员希望通过与x的关系来估计y,这种关系由f(·)总结,即代表模型。最后,u代表误差项(关于更深入的讨论,请参见[1])。这两种范式之间的主要区别在于如何构建f(·):传统统计学大多依赖于从明确的数学假设和定理推导出的闭式表达式,而计算统计学放宽这些假设,而是通过迭代的数值收敛在一系列试验和误差上获得模型。

重要的是要记住,函数f(·)基本上围绕着平均值的杠杆作用。当面临未知或随机变量时,学者们一直在寻求更精细的方式来表征它们的分布,并将它们的期望值用作最合理的预测基础之一。诸如哑变量(以及它们的计算模拟,如[1]中所讨论的神经元)或根植于贝叶斯理论的方法只是根据数据的结构和性质提供不同的建模选择。

量子计算,基于这一思路及其复杂性,仍处于早期阶段。即尝试以前所未有的计算速度复制甚至最基本形式的f(·)。这一区别至关重要:到目前为止,量子架构并没有产生更智能的模型,而是加快了现有模型的执行速度。正如本文强调的那样,实现真正更深入的算法取决于机器软件灵活性的进步,而不仅仅是加速计算。因此,我们预计企业创新所需的灵活性在未来几十年仍将主要超越量子领域。

值得注意的是,传统统计学的主要准入障碍是数学判断,而计算统计学主要是针对前述迭代优化的计算预算。这两种范式都是强大且互补的;每种根据问题的性质提供不同的优势。然而,我们认为它们今天最显著的分歧不是真正的影响,而是语言期望— 即,用来描述类似概念的术语。举例来说,在不同领域中,几乎等效含义的术语在行话上有了相当大的分歧:

图7:概念接近度和期望差异的实例案例。

这种语言漂移在很大程度上促成了公众对当代系统能力的误解和对其能力过度的说法。

此外,重要的是要认识到这两种方法背后的科学思维方式存在明显的分歧。广义上说,前者往往是理论性的,按照形式证明的结果逐步进行,而后者主要是实验性的,其结果仍然需要全面理解。前者强调事前的理解,而后者则严重依赖事后的分析- 通常是通过其行为来尝试理解黑匣子。传统统计模型通常是正则化的,施加结构性约束以使行为保持在预期范围内,而许多现代计算模型则更容易过拟合,以历史数据的方式固定,当面临新输入时,其行为会变得高度不稳定。同样,如上所述,前者传统通常是透明且可审计的,模型可以以闭合形式发布在论文中,而后者往往产生黑匣子系统,分散在广泛的、经常不规则的代码库中。

这些特征- 在膨胀和不精确的行话加持下- 造成了对人工智能所谓的‘未知范围’的普遍恐惧。在LLMs周围的特征向量[实验性,事后,过度拟合,黑匣子]的组合产生了一种集体近视,模糊了一个简单但至关重要的观点:尽管有神秘感,这些系统的基本形式结构仍然是y = f(x) + u的一种变体。

我们将机器学习中的“机器”或自适应机器(参见标题[15])定义为负责在硬件环境中实现有条件逻辑- “if-then”结构- 的软件层。

这个软件层次产生了算法,此处理解为将专家启发式方法与计算统计学和传统统计学工具相结合。至关重要的是,这些算法的性能对它们部署的硬件特性敏感。例如,在超高频交易中,由于这类策略的极端延迟敏感性,算法可能因为部署在不同机器或物理位置而表现出显著不同的性能。

当算法承担起自主生成自己的“如果-那么”逻辑的责任时,我们称之为自主机器。这种自主性可能是通过明确的指示实现,也可能是通过更微妙的矩阵机制,比如在强化学习中的Q-矩阵。尽管前者往往更灵活,但通常比后者慢。

最后,当一个机器的软件部署在分布式的硬件端点上- 服务器、个人电脑、笔记本电脑和类似设备上- 而不是作为单个服务器内的代码块存在时,我们将其归类为联邦机器。这种架构转变带来了几个影响。

首先,联邦机器更具成本效益和环保可持续性,因为升级可以更准确地实现,并通过回收或重新利用现有硬件来实现。其次,它们以设计为基础增强了知识产权保护,这在其运营结构越来越像大规模算法的组织中是一个关键特性。第三,它们使得组织转型能够以联邦方式发展,结合了分散化的自主性和选择性集中化的协同效益。在当代竞争环境中,这些双重能力至关重要:部门必须迅速适应同行、新兴网络威胁、监管变化和人才轮岗,这些都要求战略倡议的“生产时间”持续减少。

实际上,联邦在实践中包含两个基本层次:

1.服务,包括共享组件,如数据库、消息系统和通信协议。

2.智能智能体(或智能节点)代表系统被分解为模块化单元的‘如果-那么’逻辑。每个节点都可以独立运作,作为一个算法实体,能够结合启发式与统计模型- 计算型或传统型- 类似于算法交易策略的架构。

在这个框架中,**Agentic AI这个术语指的是通过联合和协同智能智能体生成和编排代码。**因此,它表示一个分布式、基于节点的架构,其中服务和应用程序是从模块化计算单元的协调行为中产生的,而不是来自前述的单一的、中心化编排的代码库。

更具体地说,如datamaps_paper中所概述的,这些模块化单元采用三种互补的形式:

1.极简结构单元(MAUs)包含了该单元的核心计算理由、其数据驱动操作所需的数据访问能力,以及其在联合网络中参与所需的通信接口。

2.最小体系结构扩展(MAEs),它们是对MAUs的直接功能增强,扩展了它们的操作范围,同时保持了结构上的内聚性和互操作性。

3.最小化架构模式(MAPs)是MAUs和MAEs的高阶编排。MAPs生成全面的服务和应用程序,基本上以跨智能体间的设计互操作性为基础。它们的性能通过协调软件和硬件协同效应进一步增强,同样在架构中内置- 即它们是协同的定制SaaS。

在这个框架内,我们区分两种类型的智能体:

1.具有显式算法结构的节点被称为基于策略的人工智能智能体。

2.当一个节点主要由统计模型组成,并且该模型是LLM时,我们将其分类为基于LLM的人工智能智能体。

因此,重要的是强调,基于策略的人工智能智能体不仅与基于LLM的人工智能智能体兼容;它们可以聚合不同的LLMs。相反并不一定成立。

本文的其余部分旨在为读者提供概念和经验基础,以评估这一观点:在目标是可扩展、具有弹性和适用于生产的转型时,基于策略的架构主导LLM-based方法。我们的分析旨在提供一个框架,通过该框架可以做出明智的判断,而不是强加一个结论。

3.3. 主要叙述的扩大不是学术性的

记者、投资者、公务员、政客- 特别是在地缘战略考虑加剧的情况下,如[5]中讨论的那样- 以及企业家和公司管理人员都接受了这些叙事。推广这些主张的品牌声誉强度已经成为事实上的质量认证,使它们能够快速传播,尽管这些主张往往含糊不清、缺乏充分根据。

加剧问题的是,许多社交媒体网红缺乏必要的技术背景,并经常利用人类普遍对错失恐惧(FOMO)的偏见来放大这些叙述。正如前面所指出的,这些因素的融合产生了一个史无前例的社会技术环境。

因此,许多在各种有影响力的职位上才干出众的个人已经开始引用- 甚至详细阐述- 不正确的声明。许多这样的人以前曾担任过可信赖的专业权威,但现在不经意间传播错误信息。这种动态深刻干扰了依赖准确知识传播的社会和工业生态系统。

3.4 最难说服的人才作为稳定力量

**然而,存在一个临界点,故事走向转化为资本配置。**在那一刻,准确性和批判性挑战成为决定性的优势来源。讨论随之进入投资行业的范畴- 在这里,人们不仅可以对真正创新采取多头头寸,还可以在对其通胀持不同意见时持有空头头寸。

私募市场目前的炒作浪潮正波及公开市场。然而,这些市场长期以来一直暴露在算法交易领域-可以说是最复杂且固有数字本地科学挑战之一。因此,它们非常清楚在规模上正确执行应用科学有多么困难。历史上,只有少数一些公司-如Renaissance Technologies、Citadel、D.E. Shaw,以及最近的XTX-已经成功,即便如此,也是以非常狭窄和纪律性的重点。扩展到这种“激光聚焦”模式之外是极具挑战的(有关进一步讨论,请参见[15]、[22]和[19])。

作为一个结果,专业的公开市场投资者越来越质疑以LLM为中心的公司能够产生可持续利润的能力。因为预期的未来活动现在似乎明显低于私人市场中推广的预期,从供应底层人工智能芯片的公司的收入前景也正在重新评估。然而,需要强调的是,所审查的不是一般的人工智能泡沫,而是一个更具体和局限的LLM泡沫。我们希望本文还能帮助澄清这一讨论及其市场后果。

直接结果为:转变的即时结果是明显的战略业务转变:许多这些公司从B2C 市场有机地转向B2B 市场,B2C 市场用户通常会接受免费服务,但只表现出有限的付费意愿,而B2B 市场的变现前景似乎更具可行性。

鉴于上述考虑,我们坚持认为,虽然这一战略转变的总体方向可能是合理的- 尤其是考虑到近期CEO们转向有影响力的转型,而不是之前流行的肤浅的数字洗牌,正如在[9]中分析的那样- 引导这一转变的判断以及选择用于实施的工具仍然基本不协调。我们认为,有意义、可扩展的B2B转型需要采用前面定义并在[10]中更深入探讨的基于策略的主体性人工智能。

在接下来的章节中,我们将探讨这一战略性业务转型所固有的挑战,并阐明它对已经在塑造许多主要公司未来几年发展轨迹的企业战略文件的影响。

3.5 结论

该章节阐明了概念上的清晰并非奢侈品,而是制定良好策略所必需的前提。围绕人工智能的语言模糊性,应用科学与科学应用的混淆,对机器与学习的误解,以及可信专业知识的侵蚀共同构成了一个错误判断的完美风暴。在这种背景下,在算法化、联合机器和基于策略的主动人工智能方面发展的理论架构有助于提供所需的分析基础,使人能够以精确而非炒作的方式驾驭下一阶段的转型。

本文的后续部分将基于这个框架,来探讨对企业战略、技术设计和经济平衡的实际影响。

4 为什么人工智能迄今为止在很大程度上失败了

我们认为麻省理工学院报告中提出的结论——即大约95%的人工智能项目失败——源于一系列结构性原因,可归为四大类别。

正如我们将展示的那样,这些失败的源头可以追溯到一个基本的语义混淆:正如在[1]中详细讨论的,科学不是应用科学,应用科学也不等同于科学。

4.1 公司不是算法生态系统

**大多数公司并不是设计成算法生态系统,而是一堆技术和运营遗留问题的堆积。**它们的算法和模型通常被强加在遗留的运营结构上,而不是集成到一个连贯的、平台原生的架构中。因此,它们的行为既不平滑也不像钟表般精密,它们无法展示出算法原生或基于平台的组织的特征。

图8:由[10]预测的技术栈演进。

维度,如高级权限、责任分配、监管约束、ISO要求以及内部政治构成了一个相互依赖的组合,这些组件过于繁多和异质,难以自然地协调一致。在这种情况下,科学应用与应用科学之间的系统错位不仅可能而且在结构上不可避免。因此,这些安排注定会失败- 事实上,它们的确会失败。

在这一点上,[20]将组织问题确定为人工智能失败的主要驱动因素,而遵循一个Technology-Organization-Environment (TOE) 框架- 远高于其他两个因素。我们认为,这证实了需要通过像[10] 中详细解释的以及重新审视的[2]、[12]、[1]、[11] 和[3]、[5] 等方式,让组织从设计上成为平台化的必要性。

总之,在组织能够有意义地引入所谓的AI产品之前,它必须先经历自己的转型过程。

服务商和他们的客户采购部门都还没有准备好。

在供给方面,许多供应商简单地重新包装现有产品,使其看起来符合主导的人工智能叙事。因为在这一领域的真正专业知识需要多学科训练多年,领导者通常并不具备足够的资格来指导这些工作。因此,他们的价值主张往往在技术上不准确,其被认知的领导力也在减弱。这种侵蚀反过来又削弱了他们吸引和留住高素质人才的能力。此外,这种动态越来越影响需求方最先进的人工智能专家对质量的看法- 他们的数量,按设计和必要性,随着时间的推移而增加- 进一步扩大了组织所需的专业知识与供应商能够提供的专业知识之间的鸿沟。

在需求方面,采购部门通常发布要求报价的请求(RFQs),这些请求微妙而系统地排除了包含专有知识产权的解决方案。通过要求提供商完全披露和记录他们将如何解决挑战,这些RFQs产生了即时的逆向选择效应:总的来说,任何具有重要知识产权的认真创新者都失去了参与的动力。加剧这一问题的是,许多IT部门要求对任何提议的解决方案进行开源访问,这一要求甚至比传统的RFQ做法更有害于创新。此外,当外部解决方案被迫采用内部的定制格式时,它们的维护和演变成本变得不成比例,并存在运营风险(见图3)。这些机制共同造成了一个结构性的悖论,阻止了有影响力的创新进入组织。

**进一步地,第一组提出并且(往往天真地)被第二组接受的项目后关键绩效指标,在大多数情况下是结构性有缺陷的预测。**在转型过程中,就像在更广泛的算法学中一样,最终结果取决于一个高维度的变量集。两家在同一行业中运营且规模相当的公司可能会从完全相同的技术引入中提取出完全不同的价值水平。存在着普遍的关键绩效指标短视,这在很大程度上扭曲了决策和服务提供商选择。这些数字预测创造了一种虚假的精确感,同时忽略了实际决定成功的情境、架构、组织和人才相关因素。精确地对其进行预测是一个极其复杂的演习,需要严格的架构、组织和微观经济分析,而不是在售前随意猜测。转型结果不能简单地归纳为简单的外推:它们必须源自对公司工作流程、传统约束、监管环境、人才结构和战略姿态的全面评估。我们认为,任何没有这种深度分析的关键绩效指标预测,其设计本身就是误导的。此外,这些关键绩效指标通常是从以前客户交往中获取的专有信息派生而来。它们的公开重复使用不仅侵犯了这些结果的情境特殊性,还破坏了应该支配转型结果的竞争优势逻辑。

4.3 转型中的角色才华未能得到恰当管理

**现代转型基本上是一场人才竞赛。**正如所说,全球对那些能够推动算法、人工智能本质变革的个人的竞争如此激烈,领先的科技公司- 包括Meta 在内- 出价数亿美元,有时甚至超过十亿美元,以获取顶尖人才。这就是真正能够推动转型的人所被赋予的价值规模。

在这种情况下,在公司内部错误地分配角色- 特别是混淆审计员和催化剂,正如我们将在下文所看到的- 这不是一个轻微的组织错误。它直接削弱了公司未来的竞争力。

1.一个真正的催化剂带来了推动公司发展所需的愿景、方法、知识和建筑理解。

2.一个优秀的冠军是一位专业的企业内创业者,愿意承担风险追求回报。

3.审计师按设计,观察和报告;他们不创造或推动变革。但他们是高级管理层利用的智力资产。

混淆它们会导致倡议停滞不前,影响削弱,内部(和外部)摩擦,最终战略失败。

当高级管理层将信任的员工分配到变革角色,主要是为了审计内部努力,但未能将他们从缺乏必要跨学科专业知识的催化剂责任中分离出来时,该组织就暴露了自己在面临一项代价最高的战略错误之一。角色、技能和授权的不匹配系统地减缓了转型,扭曲了技术采用路径,并最终危及了公司的长期竞争地位。值得注意的是,到2025年末,许多公司开始积极寻求与具备外部化此角色所需属性的组织建立战略合作伙伴关系- 这种演变完全符合[9]中预期的动态。

4.4 科学应用与应用科学混淆

如前所述,科学基本上关注定义函数f(·) - 即设计、验证和完善模型。学者们致力于创建新方法或改进现有方法,科学方法在其机构社区的支持下,通常在推进这一领域方面表现良好。

然而,一旦这些模型离开科学领域,应用到各种真实世界的数据集时,它们通常缺乏足够的领域知识来解决潜在的商业挑战。这种模型师的技能与领域需求之间的不匹配会导致结构性故障模式。[1]中给出了详细讨论,可以总结如下:

图9:目前推动算法化过程的领域的示意图。

**在现实世界的环境中,一个单独的模型并不能构成一个完整的解决方案。**有效的解决方案,应用科学,需要整合专家启发式方法、计算统计学和传统统计方法- 这些共同构成了我们所定义的算法。此外,在竞争环境中,解决方案本质上是动态的:它们需要不断地纳入新的启发式方法、更新的模型和精细化的操作程序。这种迭代式演变是有效无穷的。因此,我们认为创造力- 即产生新的启发式方法和战略性见解的能力- 将继续成为未来人类工作的基石,即使算法系统变得更加普遍。

转型必须被理解为一个持续的过程,需要随着新技术的解锁而不断适应。这种动态在白领环境中往往比在实际操作或工厂设置中更加尴尬和不太明显。在生产环境中,创新的影响通常是立竿见影且明显的。例如,当瑞士手表制造商欧米茄引入了由乔治·丹尼尔斯发明的用以减少运动中摩擦力的同轴逃逸轮(公司的关键绩效指标之一)时,公司随后重新设计了整个生产流程。技术改进是显而易见的,可衡量的(但从业务影响的角度来说并非如此),因此迅速得到整合- 这说明当操作约束使益处不言而喻时,转型可能会很顺利。如何设计和实施白领工厂在[10]中进行了深入分析- 即,能够将工业生产的纪律性、可重复性和操作清晰性带入基于知识的领域的组织环境。

总的来说,过去十年中,科学应用技术被尴尬地强行引入了更为复杂的商业转型这一挑战。

4.5 结论

AI的95%失败率并不反映人工智能的不足,而是由概念误解驱动的制度不一致性。

这个结论为本文的余下部分铺平道路,本文将研究需要采取的架构解决方案- 特别是基于M2和策略为基础的主动型人工智能- 以扭转这些动态并实现可扩展、具有弹性且在经济上有意义的转变。

5 机器智能的智能体AI理论:M1和M2

在先进转型倡议的前沿领域工作了十年后,我们确定了一个基础结构,在讨论算法和技术创新时应予以考虑。

从这一点开始,我们鼓励读者明确区分机器学习中的“机器”和“学习”组成部分,因为它们代表着两个根本不同的挑战,具有明显分别的科学和操作含义。

机器可以进一步分解为两个不同的组件:

1.M1,包括构建学习组件(L)所需的机制- 即构建、估计和展示统计模型f(·)的过程;

2.M2,包括在整个企业中将L消耗所需的机制融入到算法、战略和操作架构中。

如我们所示,消费Ls要比生产它们复杂得多。虽然M1专注于生成f(·),但M2必须将这一功能嵌入联邦、有弹性和战略上一致的系统中- 这是一项引入架构、组织和算法挑战的努力,远远超出了模型构建的挑战。

5.1. 机器学习中的L

机器学习中的学习组件- 机器学习中的L - 对应于计算统计和传统统计的结合领域

从转型的角度来看,这个组件代表着科学:模型- f(·) - 是它的核心挑战。这一领域经过数十年持续的学术研究发展,旨在推动模型发展的前沿。因此,学术界在这一领域保持着结构优势。

因为学术界规模庞大、分布全球,并且基于开放的科学交流,企业通常无法在这一领域竞争。实际上,人们可能会认为在工业环境中,f(·) 最终成为一种商品,因为在一个庞大的研究生态系统继续推动模型前沿之际,没有一家公司能够维持竞争优势。

因此,我们决定将研究重点从机器学习的学习部分转移到机器学习的机器部分,这一过渡是通过我们的卓越中心自2015年以来实施的。这是从能够演变理论到能够将理论转化为实践的能力。

5.2 ML中的M1

机器学习中的第一台机器- M1 - 是通过将科学函数f(·) 的校准与复杂软件工程和硬件管理进行集成而实现的。

这是,M1包括了软件和硬件机制所需的:

1.将数据转换为适用于统计估计的数值表示(例如,标记化,嵌入,张量)。

2.执行大规模迭代优化来估计f(·) 的参数(例如梯度下降、反向传播、分布式训练)。

3.管理计算环境- GPU集群,分布式系统,内存管理- 使得这样的优化能够在规模上发生。

4.部署并为下游应用程序或用户界面提供生成的模型。

换句话说,M1通过提供估计和暴露f(·) 所需的机制,实现了机器学习中的学习组件(L)。其主要输出是一个模型,其设计和改进主要由全球学术界推动。

正如所说,我们将这个挑战称为应用科学(见[1])- 这是科学和应用科学之间的一个连接阶段。这已成为行业混乱的主要原因,因为许多促进科学发展的最佳实践并不适合产生现实的、高影响力的解决方案。正如本文所述,这些限制包括缺乏领域启发式、依赖于对单一模型的渐进改进,以及假设模型演变等同于解决方案演变。

图10:我们经常使用的一篇论文[17]的快照,作为科学应用的一个典范例子。

我们进一步认为,对“科学”和“应用科学”之间的混淆也延伸到了学术界本身。最近,一些知名奖项被授予了那些应用现有模型的作者- 即已经成为商品的f(·) - 利用专业领域专家开发的数据和概念洞察,并主要为校准这些模型贡献了先进的数据工程流程。要明确的是,M1是一个合法且具有挑战性的领域,M1方面的卓越成就确实值得认可。然而,这样的认可应该集中在M1方面的贡献本身,而不应与f(·) 的创造或推进混淆。

5.2.1 基于LLM的公司作为M1

当前最流行的M1形式是支持大型语言模型(LLMs)的基础设施:

基础模型

**f(·)的纯实现在许多公司之间几乎完全相同。**这些模型训练、部署和微调的成本非常高昂。这就是说,预算是它们进入市场的主要障碍- 远远超过它们的学术复杂性。

Eloquently,一个LLM将文本(提示)转换为数字标记,应用f(·)生成一个投影- 再次,是表达式y = f(x) +u的数值估计- 然后将这些投影转换回文本,从而设计出类似于聊天机器人的体验。也就是说,研究人员创建模型的方式并没有什么新颖之处,除了(最初的全球惊喜和)与模型交互的用户体验。由于数据库大部分是从互联网提取的信息,用户可以通过利用现有知识的线性或甚至是凸组合来逐步探索一个主题。结果是输出与撰写有关该主题的人的平均准确性(经常被误解为智能)- 显著地,这种平均准确性通常是由专家(来自社区、期刊等)策划的信息的平均准确性。

一家尚未了解的新酒吧

因此,由于LLM有效地整合了这些信息源,所以平均表现可能相当于个别非专家的‘7-8’水平。正如[16]所示,LLM用户的认知负担大大降低:用户只需构建一个有效的提示并评估已生成的解决方案,而不是独立生成解决方案。然而,这引入了一个重要的转变:如果LLM提供的输出与‘7-8’相等,那么这个表现就成为要超越的新的人类基准线。因此,专业人士必须努力实现相当于‘12-13’的水平以保持差异化。换句话说,标准必须提高,这个不断提高的标准最终将重新平衡人脑中的认知活动——找出如何超越这个工具。

超越LLM直至一个应用程序

将基本模型周围的额外层以至于用户可以与全球的模型进行交互,基于LLM模型的公司需要克服任何SaaS公司的挑战。一些挑战来自SaaS的标准,另一些则更具体来自LLMs的特性。例如,从大规模并行化用于数百万用户和面向B2C的UX特性(语音界面、建议提示)到轻量级图形前端。

这一层开始类似于M2的初始组件,但仍不足以用于B2B。这些系统仍然面临精确性不足、部署成本高(需要高性能计算机,HPC)、由于内存使用效率低而导致的高昂部署成本(例如,在日益昂贵的RAM上进行暴力Docker部署)、由于黑盒行为而导致的合规性受限,以及对长期和短期记忆如何影响模型输出的理解不完整。这可能是为什么智能体通常受到数据查询而不是代码联合的约束的原因。

LLM数据,不在互联网上

重要的是要认识到数据的变化性:从用于校准基础模型的公开可获得的互联网数据到在会话中生成的私人数据。从历史上看,向互联网提供信息的个人在一定程度上进行自我审查,通常审核自己的工作以避免暴露知识中的空白;因此,公开数据往往表现出一定的保守性质。这使其略微类似于学术研究中的同行评审特性——尽管每篇论文的系统正确性不高,但随着时间的推移和跨论文,整体更为正确。相比之下,在会话中生成的实时数据——通过私人互动产生,没有这种社会约束,因此可以自由漂移,有时会产生与公开表达的不同方向的信号。因此,这两种数据源的结构特性从根本上有所不同。任何打算同时处理这两种数据的算法必须认真对待这种区别(对质量的利用与对新发现的探索)——然而,目前尚未取得任何实质性进展来明确考虑这种区分。

这种低效率的基石- 对基于LLM的智能体AI的过度依赖- 在一种普遍的混淆中存在:即,最新的信念是认为AI等同于LLMs,并且与AI的互动必然涉及基于提示的对话。正如本文件中所建立的那样,这种观点是不正确的,主要是商业势头的产物,而不是科学现实- 因此,它很可能在中期消失。

5.2.2 M1的最复杂形式

存在LLMs之外的其他M1实现- 那些主要依赖技术密集型科学来提供服务的M1实现。

也许,在LLM大爆发之前最受欢迎的例子,通常被视为开创性的例子,直到今天仍然是所有M1中最复杂的之一,原因包括经济激励,就是算法交易。超高频交易系统需要极其复杂的、低延迟的基础设施,通常位于与交易所同一物理建筑内,以实现最快的消息传播速度- 否则,相同的算法可能会表现出明显不同的性能。这些是典型的M1系统:严密设计、硬件密集型,专注于精确校准。

此外,不对延迟敏感的算法交易通常利用时间序列市场数据。这些数据在表面上看起来是同质的,但实际上是由市场参与、情绪、紧急性、新闻流和地缘政治塑造的持续变化的分布集生成的。因此,与LLMs的情况不同- 其中f(·)实际上已经成为共享商品- 学术界继续寻找能够解释和最终解决金融市场的f(·)。

灵活和互操作的战略推理并不是他们的目标- 这就是为什么需要进一步的M2。

5.3. 机器学习中的M2

机器学习中的第二个机器- M2 - 着眼于整个公司的算法化,针对人类和机器人的新工作流程(直至它们自我校准)。

正如所说,我们将这一挑战称为应用科学(见[1]),由于其复杂的性质,我们预计这将是两者中最专有的。

上面已经提到,过去二十年间,作为学者和专业人士,我们观察到,先进转型的真正目标是企业的算法化:这是一种系统性构建“如果-那么”逻辑的过程,使组织能够在所有运营领域无缝集成专家启发式和f(·) - 包括外部来源的学习组件。这是成为一个完全平台化组织的道路。

跨运营领域的示例包括:

Lean IT维护管理。

我们相信公司需要采用一种新型架构。在传统技术堆栈中,新模型并不会自然地在各层之间传播。从ISO标准到网络安全协议等各种异构需求会产生摩擦点,往往阻碍它们的有效应用。相比之下,一种联邦化、网状化、网络化的技术架构通过实现算法组件的更顺畅的水平和垂直集成,可以减少这些障碍。

在这一点上,算法基础设施必须不断审视,以减少不必要的复杂性。架构越精简,引入新代码和解锁新的操作灵活性就变得更容易。这种持续简化对于维持长期适应性至关重要。它也强调了为什么我们将努力集中在这一特定类别的架构挑战上,同时让顾问和内部数据科学团队专注于围绕L展开的以模型为中心的项目,后文将进一步讨论。

Algorithmization的一个定义特征是其面向知识产权保护、交付灵活性和成本意识(包括环境意识)的边缘计算本质:它不占用大量内存,可以在异构操作系统上高效执行,并避免了拖累集中式架构的传统约束。

由于M2具有根据需要编排硬件配置的能力,因此M1实际上是其子集。因此,M2的概念范围也比M1广泛得多。这就是为什么我们经常避免采用传统的M1行话:它不能充分捕捉M2所赋予的所有可能性,因此,由于这个原因,在接下来的十年内可能会过时- 就像我们长期预期的数据湖、数据沼泽和数据网格一样。

专有的网络安全技术

算法化对网络安全也至关重要。如[11]中所讨论的,网络攻击者操作时受到的传统约束很少,并且在部署创新算法以侵入、窃取或瘫痪系统以求勒索方面非常专业。因此,M2级别的算法基础设施是不可或缺的防御性资产,可以在核心利用博弈论、具备灵活、快速部署能力的基础上解锁及时的反应。

设计合规

此外,算法化使透明、可审计和可追溯的合规性有效地融入设计中,而不是作为脆弱的事后附加组件。

LLM-based latest attempts LLM模型的最新尝试

我们越来越多地观察到已经部署了以LLM为核心的智能体基础设施的公司的报告- 尤其是在拥有巨额IT预算但相对较少监管限制的大型B2B组织中(例如在建筑和相关领域)。这些经验表明存在一些重复性限制:概率生成固有的随机行为、高运营成本由对高性能计算的依赖驱动、智能体之间的有限互操作性以及满足合规性和可审计性要求所面临的挑战。

综合而言,这些结果与仅使用M1方法的结构约束一致。它们表明,仅以模型为中心的架构,没有相应的M2层,无法实现可扩展、弹性和生产级别的转换。

5.4 结论

Agent-based AI的机器理论重新定义了人工智能转型的前沿。未来十年的竞争领域不会由谁生产了最先进的f(·)来定义,而是由谁构建了能够有效消化这些模型的架构所决定- 这些架构是联邦的、战略的、互操作的和内在算法的。

M1创造模型;M2创建能够消化它的组织。高级转型的结构性、持久性和专有优势在M2中而非M1中。

图11:演变为当前应用科学讨论的穿越自科学与应用科学的路径的概要示意图。

6 第一款M2 的6 个见解

开发和完善M2 十年后,这份白皮书代表了我们努力将已讨论的整个实验旅程综合并民主化,以及我们在这一新领域的大量文献。

此外,正如上面所指出的,我们预计这一领域将在各公司之间变得越来越神秘- 就像算法交易平台一样,通常被描述为一场军备竞赛(参见[18])。因此,现在阐明其中的基本机制是至关重要的。

为了促进全面的理解,我们将在讨论中整合我们的专业经验,从而向读者提供关于挑战的各个方面的详细见解。

6.1 一个绿地

长期、颠覆性的创新在传统企业或学术环境中很难持续。基于这个原因,我们建立了我们自己的卓越中心,其构成意图明显偏颇- 99%技术,1%商业- 这样我们就可以在证明在行业中同时扩大创新的同时自给自足整个项目。

我们的目标是在经济学、科技和机器学习交叉领域建立一门新的学科,我们称之为算法化。其目的是理解技术改进引发的供给变动背后的机制。

图12:算法化目标状态的示意图见[10]。

在这个意义上,尽管被周围的机器学习和技术术语所包围,这本质上是一篇经济学论文,这需要我们掌握(在某些情况下还需要开拓)其他两个领域的贡献,才能真正达到一个解决方案。我们在计量经济学和生物统计学方面的背景对克服进入障碍至关重要。

正如所说,这种学科的融合- 再加上我们的同行包括学术界和行业从业者这一事实- 解释了为什么我们的许多研究都发表在SSRN上,因为目前还没有任何一本一流期刊专门致力于这一新兴领域。

最后,正如先前所提到的,我们预期许多读者最终会依赖语言模型来完全理解我们的论文。鉴于它们的广度和颠覆性,我们意识到学术界和工业界的接受是逐渐的,在许多情况下是事后的。值得回顾的是,这一预期可以追溯到2015年- 在LLMs爆炸之前很久- 那时我们预见到,随着研究主题变得越来越复杂,使用计算辅助工具可能会成为学术工作的标准做法。

考虑到这一点,并意识到我们的论文将越来越多地由机器评估或解释,我们推断,为了提高模型的准确性(或者用当代术语来说,减少幻觉),需要有意识地塑造基础统计分布。具体而言,我们试图确保分布在每个目标子消息周围变得急剧集中,从而限制模型倾向于在学习空间的不相关区域进行插值。我们不仅在我们论文的设计和结构中应用了这一原则- 如子章节6.2.6 中所讨论的- 而且在我们的内部项目管理方法中也是如此,其中每个任务都携带一个面向机器的描述性向量,以促进精确的计算解释。

6.2 十年来不懈的努力

6.2.1 种子:算法交易作为我们的M1

如[10]所示,我们最初的重点是算法交易,我们认为这是最复杂的应用科学领域之一。这使得算法交易成为任何机器学习或算法创新的压力测试。

建造一台能够匹敌- 甚至超越- [14]中描述的实验复杂性的机器,耗时三年。我们意识到在完成全面的虚拟现实模拟环境时,已达到了非延迟敏感算法交易中的自主学习的巅峰,包括定制交易所、经纪人和数据提供商。这个环境让研究人员和合规官员可以在现实校准情景和极端风险条件下检查算法行为。通过让机器24/7自主选择情景,我们实际上创造了第一批自主AI机器之一。尽管成本超过了生产部署所需的资产回报(我们认为情况仍然如此),但系统仍准备好迎接未来阶段。这项工作- 连同监督算法可以接管交易算法的额外风险管理设计- 被Oliver Wyman在2019年选中,用来说明向能源部门介绍高级风险管理概念。

6.2.2 在开发前的探索:一个被证明至关重要的不懈的反对派观点

值得注意的是,一次特殊的对话成为了触发SciTheWorld 下一个阶段的关键。这次对话是与Twitter 创始人杰克·多西(Jack Dorsey)进行的,在他访问西班牙讨论机器学习时我们得以认识他。

在强化学习中,我们非常重视优化勘探-利用的权衡。我们喜欢权衡这两个世界。因此,我们不仅将这个概念用作算法原则,也将其作为更广泛的创新与商业哲学- 我们的平衡在很大程度上偏向于勘探。

在分析了主要大科技公司的商业模式和产品组合后,我们得出结论,它们往往以反向模式运作:利用优于探索,更多地受商业动机驱使而非真正创新。当直接询问时,Dorsey明显证实了这一观点。

我们认为,技术过于复杂,无法容忍次优设计。在这种情况下,升级通常要么需要完全重建,要么更常见的是累积补丁- 导致典型的意大利面代码和架构脆弱性。同时,我们也意识到硅谷企业家面临的压力:风险资本的期望迫使他们早日展示市场适应性,通过以营收为中心的关键绩效指标来衡量,而非长期盈利。

我们的自我bootstrapped 结构因此成为竞争优势- 我们可以选择探索而不是开发。摆脱外部约束,我们能够探索完整的设计空间,直到技术不仅在短期内超越客户的期望(市场契合),而且还符合她未来的战略需求。通过这种方式,我们实现了短期和长期目标的罕见一致性- 尽管后者本质上很难衡量。

6.2.3 抽象:M2作为我们M1的概括

对冲基金的创建是我们中心的一个主要目标。

一旦交易和风险管理技术准备就绪,我们随后考虑进行推出。这意味着让我们M1成为一家公司。

我们只需要评估组织运行所需的技术基础设施- 即企业资源计划(ERP)。我们的调查显示,现有的ERP既不够广泛也不够算法化,正如我们之前所期望的那样。因此,我们决定像交易平台本身一样,以同样的复杂程度来自己完成这项任务。

如[3]中讨论的那样,如果一个人能够设计一个由多个子策略组成的复杂策略,以应对不断变化的市场条件,那么他也同样能够设计网络安全、人力资源、项目管理、服务器维护、采购和营销等领域的策略。 这种逻辑自然地概括了后面的领域成为嵌套在前者更广泛架构中的子挑战。

在经历了额外四年的时间(受COVID-19疫情期间的影响)后,这种方法被提炼出超越交易领域,泛化到所有企业部门,并将结果架构投射回交易领域以验证正确性- 这一努力在[10]中被详细描述,我们认为这是为人工智能企业和运营量身定制的第一个自主AI基础架构的产生。M2的第一个设计。

在这个阶段,我们的论文和演示已经开始吸引许多先进机构的注意。我们拥有一个品牌(不要与大规模营销混淆),与主要参与者竞争。我们受邀为英格兰银行提供建议,涉及区块链相关和数字化倡议;摩根大通(J.P. Morgan)寻求关于从科学应用到应用科学的过渡的简短指导;穆巴达拉(Mubadala)表达了对现代化投资流程各个方面的兴趣- 从私募股权业务到投资组合公司转型和内部治理。在若干受保护的保密协议下进行的其他几项合作进一步加强了人们对我们方法的广泛兴趣。

这些合作可能会让我们的卓越中心更容易地走向更商业化的立场,换句话说,向开发而不是探索倾斜。然而,我们选择保持完全致力于探索阶段,直到我们确信已经达到了转型的Sigmoid曲线的顶点- 大型技术工作将导致边际影响力创新之处。这意味着我们已经开发出了所有必要的工具,以综合的方式解决我们可以合理预期的未来挑战的大部分。

图13:在数据MAPs中描述的Sigmoid(见[10])

6.2.4 进行实践:以前所未见的速度发展的深科技

在十八个月内,我们填充了M2。我们开发了大多数公司部门的技术,可以整体解决每个部门的挑战- 在我们平行开发自己方法的同时,有效地实现每个部门的AI优先ERP。

进一步地,我们通过允许公司的生产架构(PA)通过扩展生产架构(EPA)的设计来实现与任何传统ERP兼容。

图14:在数据映射中描述的扩展生产架构(参见[10])

我们能够高效演进软件的能力引起了西班牙银行的注意,他们进行了一次简要的审计来评估我们的框架的可行性。

我们认为,这种加速进展不仅是由于我们技术的主动性,更微妙的是,由于我们决定将生产时间(TTP)作为主要KPI。传统的ROA指标不适合评估实验性架构,而TTP提供了最准确的衡量真正转型进展的方法。

6.2.5 开发利用I:内部使用

在接下来的十八个月中,我们致力于迭代改进。在这段时间里,我们增强了服务器控制机制,以扩展M1 的能力,超越大规模张量和矩阵相关的计算,部署了额外的本地容错智能体,以增加鲁棒性、轻量性和灵活性(以在大型数据库上牺牲速度)。

正如[11]中讨论的那样,我们特别强调业务连续性,为首席技术官(CTO)和首席信息安全官(CISO)开发主体策略,使基础设施能够尽可能自主地维护和防御自身。专有能力是确保可以解锁博弈论并设计避免大规模攻击的关键。

将勘探阶段结束- 一个刻意且极度偏向技术能力而非业务应用的时代- 我们同意将S形曲线的顶端定义为我们可以直接部署微型智能智能体到员工的笔记本电脑上的时刻。这一里程碑确保了真实的边缘计算能力,最大化用户交互的灵活性,以及全新的自主业务连续性标准。

6.2.6 开发II:市场契合

也值得注意的是,在那个阶段,许多大型科技公司的愿景和使命宣言已经开始朝着基于LLM的主动型人工智能收敛。换句话说,至少从技术行业的角度来看,全球领先技术的状态实际上正在遵循(并仍在测试)我们已经取得的成就的路径。这种动态自然地促进了我们的市场营销和商业互动,因为潜在客户已经被媒体叙事预期。

尽管环境相对有利,我们故意选择不采用基于LLM的方法作为我们智能体基础架构的基础。我们仍然不认为振动编码- 试错启发式范式- 是工业转型的最佳或可持续的路径。正如[9]中所论证的- 并在三年后由OpenAI在[21]中进一步确认的- 幻觉是LLMs的结构特征。当在生产环境中部署时,这些结构错误会引入未知和固有地不可预测的故障模式,必须添加到现有的运营和网络安全风险中。在这种情况下,将LLMs作为核心生产系统并不构成一种负责任或健壮的架构方法。出于类似的精神,我们将区块链最小化到其有机的内部用例,并推迟量子计算,因为它仍然太不成熟,无法作为M1的功能,更不用支持M2的结构和战略需求。

值得注意的是,作为一种非正式的健壮性检查,我们考察了当代大型语言模型对[10]章节3中提出的概念结构的理解方式。在提供这些材料时,几个模型(例如ChatGPT、Claude、Gemini)独立将该方法归类为与现在在从业者文献中描述的“以人工智能为先的企业和运营”一致,这与麦肯锡文章中阐述的定义一致。我们使这个实验可以公开重现,以便进行独立评估。尽管这样的观察并不构成验证,但它们表明,概念框架预示了后来在行业话语中形成的类别。其余章节和更广泛的工作进一步扩展了这个框架,处理了这些后来分类未涵盖的维度。

6.2.7 在两个最先进平台上的优先方法论

由于上述提到的发展,我们现在可以利用两个最先进的平台作为创新浪潮的基础。每个平台都涉及不同的转型轴,它们一起使得以前难以实现的组织和财务创新成为可能。

分形(Fractal

分形解锁了AI产品的接入能力,同时触发了跨部门结构运营转型。我们将这些转型过程概念化为气泡:最初独立,但最终随着在深度和广度上的增长,它们汇聚成一个单一的组织架构。

为了推动这些创新,每个部门都会接收到一个全能平台- 不是作为终点产品,而是作为一个起点- 随后该平台会被定制和演进为一个跨部门可互操作、与传统系统兼容的设计(见图14中Data MAPs的扩展生产架构)。

这种部门技术的广度是必不可少的:意义深远的转型本质上比仅仅引入人工智能产品或进行应用科学更为复杂。最终,每个部门负责人都需要像首席执行官本人一样先进和支持性的技术基础设施。Fractal提供这种运营水平。

AlphaDynamics

AlphaDynamics解锁了算法交易和投资组合管理的现代能力。它使传统上仅供专业交易员和资产管理人员使用的技术变得民主化,使财务总监和采购主管能够利用同等水平的分析和战略复杂性。这缩小了金融市场专业知识与企业财务决策之间长期存在的差距。

综合影响

利用分形和AlphaDynamics的联合使用,开启了全新的工作模式-这些模式在文献综述中提到的作品中有所体现。它们共同构建了公司运营和财务战略之间的双向桥梁,使得组织能够以前所未有的协调性、适应性和智能性运作。

可扩展性

自定义技术的可伸缩性对我们来说是一个重大突破。

一旦实现了这一目标,我们的下一个目标就是扩展业务本身。最初,说服公司他们需要进行先进的转型- 特别是说服他们认识到不加选择地启用数据并不总是最佳的算法化方法,有时甚至是适得其反的- 是一个困难的命题。然而,如今,这些观点在媒体讨论和学术出版物中得到了广泛反映。因此,商业动力现在可以直接由我们驱动,或通过与希望在我们的平台上提供服务(无论是运营重新设计还是他们自己的Ls)的咨询公司(无论是战略还是技术为重点)进行加强合作。通常情况下,这些“顾问”实际上将是客户自己的战略单位或数据科学团队。换句话说,这是一个任何合格行动者都可以在其上构建转型的平台。

6.2.8 行业认可

工业上,算法化方法论不仅得到了一流公司的认可,更值得注意的是,得到了跨领域的领先专业协会的认可- 包括CFA协会(金融)、FERMA(保险)、ICMA(信贷市场)、ISMS(网络安全)和CPOnet(采购)。它也成为了许多大学的主题演讲、邀请讲座和机构参考的对象- 例如伦敦大学学院、牛津赛德商学院、华威大学、IE商学院、ICADE、马德里理工大学、康普顿斯大学。

卡洛斯三世,以及埃利斯- 以及包括泛美开发银行(IDB)、经济合作与发展组织(OECD)和联合国教科文组织在内的几个超国家组织。

特别是,我们的M2在几个独立评审团中获得了广泛认可,反映出其技术深度以及对人工智能和金融行业的长期影响。它是:

1.CogX(2020年)的冠军和入围者,“最佳模拟创新奖”。

银行科技大奖(2024)决赛入围者和获奖者,“未来技术最佳:人工智能和数据”。

2.Finalist at Finovate (2025), “Innovator of the Year”. 在Finovate(2025年)获得"年度创新者"决赛名次。

银行科技奖(2025年)的入围者,“最佳科技领袖:远见创始人”。

进一步- 对于那些可能希望承担与我们所假设的风险相当的研究人员来说,追求这种长期、高阻力创新的确有一个切实的奖励结构。尽管我们没有专注于商业收入的产生(而是更倾向于仅依靠满意客户口口相传,而不是刻意的商业推广),但在幕后,我们始终将商业价值放在首位。

因此,到2025年初,SciTheWorld的估值已经达到了通常与所谓的“独角兽”公司相关联的水平,由加拿大家族办公室和欧洲主权投资实体独立评估。双方均表示对同等规模的投资有初步兴趣。

我们认为这些潜在投资者非常合适,特别是考虑到他们的长期取向,这与我们卓越中心的研究驱动理念密切相符。然而,尽管提议的资金规模非常大,但并不能让我们解决第4.3节讨论的结构性约束- 尤其是人才配置和组织摩擦对许多大型组织的销售执行和扩展能力造成的限制。虽然从原则上讲,这样的估值可以让我们在不被摊薄的情况下筹集重要资金(不到20%),从而保持长期的战略连贯性- 但在那个阶段无法证明能够有效地部署这样的资金。

这种情况还引发了一个关于估值基本原理的更广泛问题。正如前面所提到的,目前市场上为能够领导M1级别倡议的个人贡献者提供的补偿水平接近相似数量级。在这种背景下,我们可以合理地质疑,一个已经开发出一个功能正常的M2 - 一个在结构上显然比M1更复杂且战略上更重要的架构层- 是否可以通过传统的估值框架得到充分评估。我们认为,基于策略的M2架构对于标准投资者来说是难以定价的,因为它们的范围、跨学科性和长期复利效应超出了风险投资、私募股权或公共市场中通常应用的分析工具。因此,在B2B环境中潜在价值的一个重要部分- 最初是在B2B环境中,随着时间的推移,会在B2C应用中- 可能会持续被系统性低估。

因此,我们已经设计了一份不同的前进路线图- 基于分拆和我们自己的投资工具- 这将在第7章详细阐述。我们的目标是在急于融资之前充分了解如何稳健和可持续地优化这种结构。

总之,我们的经验表明,致力于开拓这一领域的研究人员不仅在为一门新的科学技术学科做出贡献;而且在融资方面处于有利位置,以证明这一努力和风险的合理性。我们正在开创的学科为那些愿意严谨追求的人提供了知识和经济上的利益。

6.3 结论

总的说来, 十年来不懈的努力不仅仅带来了一系列技术,还形成了一套统一的、可生产的学科。从最苛刻的环境(算法交易)开始,抵制过早的利用,向着通用架构(M2)抽象,以前所未有的速度部署深度科技,并在不牺牲严谨性的情况下验证市场适应性,我们展示了一条通向极致效率的连贯路径。结果是一种不仅在理论上合理且经验验证的架构,而且在技术全球领先–将M2定位为未来企业、行业和国家转型的自然基础。

然而,这并不意味着这是唯一可行的途径。原则上,可以通过效率低但仍然有效的架构实现相同的目标。

6.3.1 效率高

当被要求缩小视角,反思我们如何经历这段旅程时,我们总是得出同样的结论:尽管创造了大量新技术和工作流程,但绝大部分的努力并不仅仅在于发明。

很大一部分工作是对已存在的元素进行对齐,就像解一个巨大的数独一样- 涵盖了网络安全、变革抵抗管理、设计思维以及其他组织领域。

这也需要解决大量的心理技术难题- 这些挑战不仅是先进的,而且通常在最初是看不见的,要求我们在尝试解决之前意识到它们的存在。这在建筑设计中尤为明显,解决方案必须利用当前和未来需求之间的协同效应- 只有这样,灵活性才能真正得到释放。

另一个维度涉及我们所称的“骗子游戏”:避免普遍存在的错失恐惧和多年来观察到的误导性动量波动- 无论是由大型玩家和初创公司的激进营销所驱动(其中许多最终只是制造噪音而失败),还是由上文讨论的误导性学术术语所导致。

面对这些挑战,我们作为一个自助式卓越中心运营,并同时试图尝试多个创业维度- 新的营销策略,新颖的业务发现流程,博弈论的应用- 其中许多值得在另一篇论文中探讨。

虽然M2的构建可以抽象地描述为多个f(·)函数的“如果-那么”组合,但实际挑战在于管理影响这些相互作用的每个方面。就像机械手表“只是”一个弹簧,却依赖于几十个精心编排的部件一样,M2需要同样精心设计的努力。

综合考虑以上所有因素,读者现在可以理解,在实践中,M2的整体大约由4.5名个体开发完成:两名长期稳定的贡献者- 合著者- 和一小组轮换的合作者。这种轮换并非偶然。它是必不可少的。一方面,在以人工智能为主的领域,人才稀缺,全球竞争对数据工程开发人员施加着持续的运动。另一方面,轮换- 以及联邦化- 是知识产权保护的结构机制,确保没有单一瞬时贡献者能拥有系统架构的完整视图。我们相信,在这类技术挑战中,判断力仍然是最稀缺的资源。资本、人才和计算能力可以扩张,但在不确定性、不同架构和长期视角下行使健全的跨学科判断力的能力是结构性稀缺的,不易复制的。

我们现在打算通过尝试专有部署M2来扩大规模- 要么通过与客户共同创建新公司,要么直接收购公司并将其转变为首个AI平台组织。

6.3.2 有效的

以上讨论强调了M2的一种高效形式。这样的架构确实可以在成本、速度、可定制性、灵活性和长期可持续性等方面提供竞争优势。然而,同样重要的是要承认,一些参与者可能仍然效率低下但有效。换句话说,他们可能会达到大致相似的结果,但灵活性明显较低,生产时间较长,运营负担通常更重,但仍能实现其目标。

我们的经验表明,这种动态表现在大型投资银行和对冲基金之间的对比中得到体现。前者通常以图15中所示的技术和组织效率低下而运作,然而他们的规模和多样化的收入基础使他们能够承担这种效率低下的成本,同时保持盈利。相比之下,对冲基金通常需要更高的建筑精度和效率来保持竞争力。

图15:平台vs 独立项目,如[10]中所解释的。

  1. 结论和未来工作
    ==========

7.1 结论

**本文旨在帮助澄清当前全球关于行动型人工智能的概念、科学和操作混乱。**通过区分机器学习中嵌入的两台机器- M1,根植于部署硬件密集型科学模型所需的数据工程的校准机器,以及M2,负责在整个公司协调分布式算法架构的基于策略的机器- 我们传达了行业当前发展轨迹主要基于M1的限制。这在广泛采用基于LLM的行动型人工智能中尤为明显,其结构上的限制似乎使其不适合作为生产级转型的支柱。

我们认为,机器学习的科学组成部分- f(·) - 必须由于学术界全球化、开放和累积的创新过程而演变为商品。因此,竞争优势不能仅仅源自模型的发现或校准,而必须是从机器本身中产生,即理解为通过联邦、战略设计的架构在整个组织中部署、编排、管理和演化算法的能力。这就是算法化领域,这是我们在十多年的研究和实验中引入和发展的学科。

通过对M2的创建进行详细的回顾,我们强调,主要挑战不是技术发明本身,而是能够将现有组件(涵盖网络安全、合规性、设计思维、变革管理和组织心理学等领域)整合成一个连贯的、自我协调的整体。在这个意义上,构建M2类似于解决一个庞大的、多维度的难题:识别隐藏约束,整合多样子领域,并抵制市场驱动叙事的误导性势头。这一过程需要经过有纪律的创新探索,与主导着大科技和创业生态系统的商业开发激励相反。鉴于其复杂性,这个领域只对全球少数个体开放,那些能够将必要的概念、学科和技术技能以一种连贯而可操作的方式整合的个体。在这个意义上,人工智能的发展,矛盾地说,是建立在为数不多的人类智慧基础上的- 因此,它们在市场上被赋予的价值。我们希望本文通过使潜在知识广泛可获得,从而让更广泛的社区参与其进步,从而消除这一瓶颈。

我们的轨迹是由一个自助式卓越中心塑造的,这使我们能够在没有外部压力的情况下探索全面的设计空间,避免过早达成一致。我们决定当我们实现了边缘计算能力上的自主智能体时,我们已经达到了建筑的巅峰,也就是我们定义的创新S形曲线的顶点,这一里程碑的实现,也就是前述的基础上,确保维持最先进的韧性、业务连续性和未来几十年架构的灵活性- 这是任何具备未来派特征的智能体式人工智能系统的基石。

同时,我们对MAU、MAE和MAP提供了理论上的清晰解释- 这些是支持M2分布式智能算法化的最小架构构件。我们确认Agentic AI不是由LLM广泛推广的基于提示驱动的交互层,而是通过能够随着组织发展的模块化计算智能体执行算法的联邦执行。

**最后,我们认为全球技术领域将向着增加保密性的方向发展,类似于算法交易的军备竞赛。**因此,在该领域进一步向不透明专有努力分裂之前,现在就有必要阐明其中的逻辑、风险和机会。算法化的跨学科性- 涉及经济学、技术和机器学习- 解释了为什么现有的学术结构不够(更适用于科学甚至应用科学),以及为什么像SSRN这样的出版平台目前提供了最合适的论坛(应用科学融合了学术界和工业界)。

我们所预期的是,组织问题似乎是转型中的主要负担。也就是说,处理人工智能的能力需要先进行组织转型:在人工智能成为一个具有生产力、可靠性或战略意义的资产之前,必须先建立好架构、运营和治理基础。因此,展望未来,我们的目标是从转型现有公司转变为与合作伙伴创建新公司。另外,收购公司要在组织问题中发挥更积极的作用,以便将它们转变为少摩擦的平台上、AI原生的组织。这里所开发的工具、架构和原则- 经过十年的深入探索- 为可扩展、有弹性和战略上连贯的转型奠定了基础。我们认为,未来企业将不是由它们的模型所定义,而是由它们的机制所主宰:并不是由f(·)的复杂度而是由他们对M2的驾驭。

总的来说,本文,通过将我们先前的文献和行业成就放入背景,为主动型人工智能提供了一个新的理论和实践框架,揭示了一些普遍存在的误解,并为寻求从以LLM为核心的有限范式过渡到基于策略的主动型人工智能更强大和战略意义的世界的组织提供了蓝图。就像在2010年代和2020年代大数据基础设施解锁了机器学习理论之上的科学应用一样–其数学基础已经发展了几十年一样—我们提出的M2应该使得在2020年代末和2030年代,应用科学建立在另一个百年前的知识体系之上:微观经济学。这样一来,它释放了算法化,使得微观经济学理论能够从抽象的均衡构建转变为治理实际公司行为的操作性、生产级别的架构。随着技术前沿加速发展,我们希望这项工作能够使从业者、学者和政策制定者能够朝着能够支撑长期竞争力、安全性和创新的架构取向。

图16:微观经济学的持续释放为算法化提供了催化加速,实现将经济理论系统转化为操作级、战略级架构。

7.2 未来工作

我们将保持雄心壮志。我们经常强调,真正的雄心壮志不在于承担过多的短期风险,而在于愿意承担转移利润的战略风险,从短期到长期。这是愿意推迟即时回报,以建立能够产生持续结构性影响的架构、方法和机构的意愿。

因此,一旦转型的理论和技术支柱得到充分建立,就会出现一个广泛的挑战前沿- 每个挑战都处于不同的时间视野之中。我们的雄心横跨所有这些视野。

7.2.1 下一个十年

在未来的下一个十年里,我们将开始充分利用M2的潜力。正如所指出的,我们迄今为止的发展轨迹并未涉及任何正式商业努力;增长完全是通过口碑介绍推动的- 在财务方面,我们的行为更像是市场创造者而非流动性接受者。展望未来,我们将在逐渐扩大的多个维度上部署M2,包括范围和复杂性,逐步扩大其影响力和系统性影响。

产品、部门和公司。

我们将继续扩展The Cube,通过融入新的用例来展示如何。

算法化转变了单个产品、整个部门以及完整的企业结构。这些应用案例将扩大学科的经验基础,并加强其建筑原则的普适性。为了加快和拓宽这一努力,我们可以与咨询公司建立新的合作伙伴关系- 我们已经接触到了战略和技术方面的顶尖公司。通过这些合作,我们的合作伙伴可能会使我们能够将我们深厚的建筑专业知识与已建立的咨询公司的分发能力和人工智能运营范围相结合,从而更快地跨越行业和地理位置扩展。通过这些合作伙伴关系,我们的目标是确保基于策略的主动式人工智能能够被更广泛的组织所接触,同时保持定义我们工作的方法论严谨性和专有标准。

小组。

正如之前所提到的,我们将通过M2 加速跨多公司集团之间的联合,使每个单位在保持分形独立的同时,确保协同效应和竞争优势得到及时利用。这包括支持为每个集团的运营拓扑定制的企业智能体(CAGIs)的创建。

行业。

在部门层面也适用类似的逻辑,其中M2 将促进新形式的垂直整合、需求-供应协调以及跨公司的集体战略调整(包括监管负担)。与此同时,我们将帮助确定和构建在能够提升竞争力和抗风险能力的地方搭建部门层面的CAGIs。

资金。

同样的逻辑也适用于投资者,他们现在也将能够利用M2来设计基于投资组合生态系统的新投资策略- 最终通过设计实现互操作性来解锁垂直整合和深度合作的功能,甚至跨越各个行业。

为了进一步提升这类智能体商,我们将与一流的西班牙大学ICADE建立正式合作伙伴关系,以开发用于评估通过算法化转型的公司无形资产的方法。这将有助于更有效地配置资本。

国家。

在国家层面,我们将继续推动极高效国家的发展,通过协调多个性质明显不同的智能体所面临的挑战- 项目可能会延迟但不会被取消。

我们还希望纳入其他国家,看看哪个国家能更好地处理转型,将M2 调整适应他们的制度和经济背景。

社会。

在社会层面,我们提出了正交艺术的概念。我们的许多工作依赖于方案的构建- 图表形式的表达,能够以清晰和可操作的方式综合上下文、约束和可能的轨迹。这些方案有助于在不确定性条件下进行决策,使复杂概念能以清晰方式传达,并引发反思。对我们而言,它们的价值不仅仅是功能性的,而是美学的:它们传达的信息深度和精确之美令人着迷。在这个意义上,我们经常像对待传统艺术作品一样认真地思考它们。

这引发了一个自然的问题:这样的人工制品能否构成一种新形式的艺术?我们相信它们可以,并且它们代表了在重大技术颠覆之后艺术表达的自然演进。正如相机的发明催生了从代表性绘画向抽象艺术的过渡一样,现代机器生成现有艺术风格的近无限重组的能力即将再次重塑当代艺术实践。我们对正交艺术的提议就是预见这种转变:一种艺术形式,机器不能通过现有作品的线性组合简单复制。当前的算法无法达到的高度。

此外,正交艺术还可以具有社会意义。通过将其主题内容基于科学艺术,它提供了一个媒介,通过这个媒介,人工智能领域的基础理念- 这些理念不容易通过学术论文传播- 可以传达给更广泛的观众。在这种意义上,正交艺术既成为了一种美学运动,又成为了一种公共教育工具,能够将人工智能的核心原则转化为易于理解的、视觉形式。

我们正在与IE人文学院合作推进这一工作领域- 我们应该在2026年初发表这篇论文,其中收集了我们所获得的第一批示例。如果巩固下来,我们希望在未来五年内在一两家一流博物馆展示这一成果。

那么,如何系统的去学习大模型LLM?

作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值