经历了过去三十多年的进化,互联网显然工作良好,因为 TCP/IP 给了我们简单、抽象、开放、弹性和中立。这些相同的原则可以指导人工智能从今天的实验竖井走向可互操作的全球规模AI系统。
1. 互联网的7个启发
面对人工智能 / 机器学习进化的日益碎片化, 我们可以从互联网中参考些什么呢?
1.1. 简单且无处不在的原则
在 20 世纪 90 年代,当互联网刚刚成型的时候,出现了包括 ISO 的 OSI (7 层) 栈在内的多种竞争模型。然而,TCP/IP 取得了成功,因为它是轻量级的、实用的,并且具有普遍的互操作性和可部署性。
在人工智能领域,我们再次面临着相互竞争的方法和支离破碎的技术栈。这里的教训很清楚: 我们需要每个人都可以采用和扩展的通用的、可互操作的框架和 API。一个 “最小公分母”,允许Agent、模型和工具跨生态系统对话。
1.2. 分层抽象原则
互联网有分层架构,其中每一层都有明确的角色,从物理层 (第 1 层) ,MAC/LLC 层 (第 2 层) ,到 IP 路由 (第 3 层) 到应用程序,它们之间有稳定的接口。每个层独立创新,但通过稳定的接口进行互操作。我们需要对 AI/ML 进行类似的分层抽象,例如: 数据 / 模型层 (用于训练和推理) ,Agent / 推理层 (用于决策和协调) 和应用 / 意图层 (人类和 AI Agent交互)。如果我们能够创建抽象层,并恰当地分离这些关注点,那么就可以避免构建单一的AI技术栈,而是像互联网那样,促进跨层次的创新。
1.3. 端到端原则
互联网是保持核心简单,把智能推向边缘。网络及其主机只是简单地可靠地传送数据包,而无需命令或控制应用程序。这一原则促成了网络、流媒体和无数其他服务的爆炸式发展。在人工智能中,也应考虑类似的原则。我们应该赋能分布式Agent和边缘智能,而不是将一切集中在 “一个基础大模型” 中。核心基础设施 应该保持简单和健壮,在顶层支持多种用例。
1.4.标准和互操作性
在互联网世界中,IETF通过 RFC 过程对标准采用开放、协作的方法,从而实现了供应商、政府和研究人员之间的互操作性。这种开放性推动了创新和全球采用。因此,我们可以在任何时间、任何地点,使用任何设备获取信息。
目前,人工智能缺乏一个 RFC 风格的互操作性标准体系,特别是多Agent协议,Agent之间的协调框架,模型对模型通信标准,包括 api 等。我们需要相当于人工智能的IETF来防止孤岛和碎片化,就像我们在互联网上解决这些问题一样。
互操作性会带来安全性问题,关于网络安全模型,可以参考林宝晶 等老师的《网络安全能力成熟度模型》一书——
1.5. 韧性和容错性
互联网的设计目标是在数据包丢失、拥塞或中断的故障下存活下来。人工智能系统往往失败不可预测,由于幻觉,脆弱的推理,或崩溃下对抗输入。我们需要一个类似于 TCP 的重传和拥塞控制的人工智能,有备份Agent、优雅的退化和自愈协议,以确保大规模的可靠性。
1.6. 可伸缩性和增量部署
互联网允许增量增长,换句话说,新的网络可以加入,而不需要重新架构整个系统。NAT、 ipv6 与 ipv4 共存、头部压缩都是在没有fork升级的情况下添加的。人工智能系统需要允许类似的增量升级,就像互联网允许的那样,例如,新的模型、加速器或压缩技术必须插入现有系统,而无需对整个系统进行再训练。
1.7. 治理与中立
没有单一的公司或政府拥有或控制的 TCP/IP 协议栈,正是中立的治理创造了全球信任和认可。互联网名称与数字地址分配机构 (ICANN) 和区域互联网登记处 (RIR) 等机构发挥了关键作用,以公开和透明的方式管理域名和 IP 地址分配,确保资源在各地公平分配。这种中立的管理允许互联网保持互操作性和无国界性。今天的人工智能领域被少数几家大型科技公司所控制。为了负责任地扩展人工智能,我们需要类似的全球治理结构ーー一个 “人工智能IETF”,辅之以中立的注册中心,可以管理模型标识符、Agent ID、协调协议等共享资源。如果没有这样的机制,将面临支离破碎、缺乏信任和跨地区采用不均衡的风险。
2. 连通性不断发展
50 多年来,通信网络经历了一系列架构演变,每一次演变都扩大了连通性的含义:
IP原生网络统一服务在一个通用的分组传输结构上。
云原生网络将基础设施抽象为可编程的工作负载。
人工智能原生网络通过预测、生成、Agent、语义和物理能力将智能嵌入到网络中。
这些网络架构是累积的,而不是连续的。每一个都建立在上一个的基础上:AI原生系统继续依赖于分组交换网络和云原生编排。它们一起扩展了网络的作用: 从僵化的运输系统到可编程的、弹性的平台,现在又朝着集成这三者的智能基础设施发展。
3. IP原生网络: 从电路到数据包再到可编程结构
IP原生网络,通过标准化语法、定义系统如何跨异构媒体通信奠定了基础。云原生架构后来标准化了业务流程,协调了计算、存储和连接性如何一起伸缩。人工智能原生网络现在寻求语义标准化,使智能实体能够共享意义并对齐意图。每一代体系结构都增加了新的功能,同时保留了以前的功能。这种从句法到编配再到语义的发展,标志着连通性的认知范围不断扩大。它追溯了网络是如何从传输数据发展到协调理解的。
如果希望从根本上了解计算机网络,可以参考本人译作《计算机网络问题与解决方案》一书——
IP原生网络代表了从多个特定服务的电路交换网络到融合 IP 网络的决定性转变。在这里,数据包已经成为抽象的基本单位: 一个独立的数字信封携带有效载荷和寻址信息,可以遍历任何媒介,并在任何地方重新组装。
电路: 在电路交换的早期,语音、视频和数据分别运行在不同的基础设施上,例如语音的 PSTN、视频的同轴电缆以及数据的 PSTN 和专用电路。它们不可互操作,难以扩展。
数据包: 分组交换通过一个 IP 网络承载语音、视频和数据。不同类型的通信可以共享同一个传输层,这为 Web、电子邮件、流媒体和在线商务打开了大门。这种简单的架构思想将信息分解成数据包并独立发送,使得全球互操作性成为可能,并使得世界各地的人们更容易获取信息。
可编程结构: 传统的 IP 网络,虽然融合在一起,却是僵化的。像路由器和交换机这样的网络设备是单体集成的,使用 CLI 手动配置,一次一个命令。SDN (软件定义网络) 通过分离控制和转发平面改变了这种状况。API支持动态流量分配,在 Google 的 B2 和 B4 wan 以及 5g 的基于服务的数据核心网络中实现。SDN 还引入了编程语言,以方便可编程控制。
这样就确立了 IP 作为通用服务底层,具有可扩展性、互操作性和可编程性。通过将数据包作为基本的抽象单元,IP原生网络提供了一个逻辑基础,所有后续的体系结构层都将在此基础上构建。
4. 云原生网络: 作为基础设施原子单元的工作负载
云原生网络扩展了从传输数据到编排分布式计算的抽象。IP 网络侧重于跨异构系统可靠地传递数据包,而云原生系统则管理这些数据包在可编程基础设施中的处理、存储和协调方式。这种演进建立在分组交换的基础之上,将网络从承载流量的系统扩展到跨分布式环境承载、扩展和编排工作负载的平台。这种演变重塑了网络的构建和规模。
在传统网络中,防火墙、 NAT 和数据包等功能是作为紧耦合集成的硬件设备交付的。扩展需要部署额外的机箱,将增长耦合到物理基础设施上。云原生设计消除了这些限制。虚拟化和容器将软件与硬件分离,将网络功能转化为可移植的工作负载,比如虚拟网络功能 (VNF) 和云原生网络功能 (CNF) ,每个功能都有自己的身份、网络链接和控制生命周期。
如果您关注云原生网络的安全风险, 可以参考马成明等老师的译作《数字时代的网络风险管理》——
随着工作负载成为基础设施的基本单元,网络需要新的方法来连接和扩展它们。云原生设计通过三个相互关联的进步满足了这种需求,这些进步使得基础设施具有可编程性和适应性:
网络特性: Kubernetes 和容器网络接口 (CNI) 定义了工作负载如何连接和通信的规则。像 Istio 和 Envoy 这样的服务网格改变了分布式应用程序通信的方式。它们使得跨越数百个微服务处理路由、负载平衡和可观测性成为可能,而无需在每个组件中嵌入该逻辑。在电信领域,同样的想法催生了云原生网络功能 (CNF) ,使运营商能够将 5g 核心部署为一系列轻量级、独立扩展的容器化服务。
统一业务编排:随着工作负载成为基本的原子单元,业务流程将以前孤立的计算、存储和网络域统一为一个协调系统。业务流程框架,比如 Kubernetes,使得跨三个领域提供、扩展和配置资源成为可能。
可编程弹性: 云原生系统将底层基础设施转换为可编程的服务结构。曾经需要手动调优的系统现在可以自动扩展或收缩。这一原则体现在 5G切片平台、微服务集群和边缘推断引擎中,在这些平台中,功能可以根据需要转动、重新定位或伸缩,以满足实时网络条件。
云原生原则并没有取代网络,它们丰富了网络,将静态系统转换为能够承载大规模动态弹性工作负载的可编程结构。
5. AI原生网络: 作为认知网格的Agent
通过将认知嵌入到架构本身,AI原生网络架构构建在云原生系统的可编程性和弹性之上。虽然云原生网络自动化了工作负载的伸缩和编排,但它们仍然主要是反应性的,在发生拥塞或阈值之后对其作出响应。随着应用程序向自治系统、实时控制和分布式 AI 推理发展,这种反应式模型不再能跟上步伐。
AI原生网络通过分布式智能扩展了这些基础,使网络不仅能够执行意图,而且能够理解和预测意图。抽象现在从工作负载扩展到智能体工作负载,即能够感知上下文、推理意图并与对等方协调的自治实体。Agent不是工作负载的替代品,而是它们的智能进化: 可以实时感知、决策和行动的工作负载。
随着Agent成为操作单元,智能从应用程序覆盖层转变为基础设施本身的内在属性。这个网络不再仅仅提供情报,它也参与其中。这种演进引入了一个语义控制平面,它扩展了传统的数据和管理平面,允许在结构内原生交换意图、意义和上下文。Agent通过这个语义层进行交互,以使目标一致并跨领域协调行动。
如果您希望了解AI 原生网络的具体应用,可以参考郑江老师的《智能风控平台》一书——
Agent依赖于以下能力:
语义路由,其中转发决策反映意图和上下文意义。
意图传播,允许高级目标跨协作Agent级联。
上下文同步,维护分布式实体之间的共享情景视图。
信任和来源,核实交换信息的真实性和完整性。
反射遥测,通过暴露机器可解释的状态将观察与推理联系起来。
这些机制共同将网络从可编程系统转变为感知系统: 能够感知、推理和协调的主动的、上下文感知结构。
在此基础上,六个核心函数定义了Agent工作负载 (云工作负载的智能延续) 的操作方式。每种方法都扩展了在云原生时代引入的能力,具有新的认知维度: 预测、生成、反射和行动。
预测智能: 模型预测拥塞、故障或能量激增,以便系统在受到影响之前进行调整。
生成自动化: AI 工具自动生成部署模板、工作流和恢复脚本。
Agent: 轻量级流程解释意图并在一个域中应用策略,比如 radio、 packet core,关闭数据和操作之间的循环。
Agentic AI: 专门的Agent在无线、传输和边缘领域进行合作,实时协商结果。
反射建模: 在推出之前,持续的模拟验证了人工智能驱动的变化,减少了作业风险
物理 AI: 像车辆、无人机和机器人这样的智能终端直接参与控制回路,融合通信、计算和感知领域,将认知扩展到物理世界
通过这些扩展,AI原生网络实现了闭环自治: 跨层次和跨领域的感知、预测、推理和行动。网络成为一个分布式的认知有机体,从经验中学习,并在数字和物理的连续统一体中不断调整其行为。
6. 架构相似性: 从单体系统到分布式网格
系统通常以集中的、单一的、紧密耦合的设计开始,这些设计为控制和可预测性进行了优化。随着它们的成熟,这些界限消失了。曾经作为单个单元运行的结构变成了分布式、可组合的结构,能够扩展、适应和协作。这种模式在定义数字时代的三个领域重复出现: 网络、计算机和现在的人工智能。每个国家都通过分配能力和信任、扩大从信息交流到协调集体行动的连通性而演变。
综合来看,这些转变揭示了一个共同的原则: 连通性的进步是由分布式AI驱动的。在网络中,信息首先通过数据包传播,数据包将信息分解成可寻址的独立单元,从而使通信具有弹性。在计算领域,同样的想法再次出现在工作负载中,工作负载将软件模块化为可以在任何地方运行的组件。在人工智能中,智能本身是通过Agent分布的: 自治系统感知上下文,推理意图,并在共享环境中协作行动。
每个阶段都拓展了可以连接、控制和协调的范围。互联网的分层架构清楚地说明了这种转变。在早期,计算是围绕大型机构建的,大型的、独立的系统和有限的通信手段。数据交换是手工的,接口是专有的,互操作性很少。标准化协议的引入,从物理传输到 TCP/IP 和 Web,改变了这种局面。一旦计算机可以说一种共同的语言,它们就不再需要集中管理。网络通过设计变成了分布式,允许不同的系统跨距离和供应商边界合作。这种语法上的统一,比特变成数据包,数据包变成流,为全球规模奠定了基础。
随着互联网的成熟,注意力从连接系统转向协调计算本身是如何发生的。云原生计算的兴起将同样的分布式逻辑从网络扩展到了计算。大型单一的应用程序让位于微服务: 封装在容器中的较小的工作负载,通过像 Kubernetes 这样的平台进行编排。而不是通过增加固定硬件来扩展系统,而是通过增加工作负载进行扩展。曾经在一台机器上共存的网络、计算和存储功能变成了分散在数据中心和边缘节点上的分布式工作负载。API将它们连接起来,编排管理它们,自动化保持它们的弹性。
在这个演变过程中,基础设施本身变得可编程,成为全球的分布式操作系统。这些可编程结构弥合了连接性和计算之间的差距,允许工作负载在异构资源之间流畅地移动。通过这样做,为下一个转变做好了准备: 从协调工作量到协调智能本身。
人工智能现在代表着这个序列的下一个转折点。早期的人工智能系统类似于过去计算机时代的主机: 大型、独立的模型独立地执行整个任务,无论是文本生成、图像分类还是语言翻译。下一个阶段引入了使用工具的模型,这些模型能够调用API、检索数据并与外部系统交互。这种进化为人工智能的发展奠定了基础,人工智能从孤立的智能走向集体的分布式认知和控制。不再是一个模型服务于许多任务,许多专门的Agent现在朝着共同的目标协作: 检索、推理、计划,并作为一个网络系统行动。每个Agent贡献原生化的智能和决策权威,允许控制集体出现而不是分层出现。通过这种方式,智能不仅在计算中分布,而且在命令中分散,将自主权从数据中心扩展到边缘。
如果您希望了解如何将现有的API 或工具封装成Agent,可以参考笔者的《MCP极简入门》一书——
在数据包分布式通信和工作负载分布式计算的情况下,Agent通过网络本身进行分布式控制和认知。总之,这些转变沿着一条连续的弧线: 从分布网络到分布式计算再到分布式认知,将连通性从交换媒介扩展到协同理解媒介。最初的机器网络已经变成了思维网络: 系统不仅共享数据,还协调目标。
7.小结与反思
网络、计算和AI已经沿着一个共同的架构节奏发展: 从集中的、单一的系统到分布的、可组合的结构,扩大了规模、灵活性和协作性。每个网络架构都扩展了网络的含义: 首先是为了通信,然后是为了计算,现在则是认知。网络通过数据包进行分发,计算通过工作负载进行,控制通过AI Agent进行。
我们一起追溯了一条从分布式网络到分布式计算,再到现在的分布式智能和控制的发展弧线,展示了连通性是如何从简单的交换发展到协调行动和集体认知的。
每个架构都引入了新的功能,同时保留并丰富了其前身。数据包统一传输,消除异构网络之间的边界。工作负载统一编排,将基础设施抽象为可编程的自适应系统。Agent现在统一了智能,将认知和协调直接嵌入到织物中。通过这种增量进化,通信、计算和认知正在汇聚成一个单一的、智能的基础设施,能够感知、推理和作为一个整体行动。
曾经规模化互联网的设计原则 (简单、开放、分层和弹性) 现在必须指导其认知进化。认知方面的可伸缩性,就像通信方面的可伸缩性一样,依赖于共享语义、模块化设计、开放接口和透明的信任框架。随着网络嵌入信息,这些原则必须扩展到语义领域,包括可解释性、伦理和责任,确保透明度随着能力的增长而增长。
核心的挑战是嵌入智能,同时又不损害使互联网具有弹性的特性: 模块化设计、增量演化和共同基板的共享管理。当竖井消失,抽象化上升,共同的理解会绑定一个智能系统不断扩大的网络,进步就会持续下去。
【参考资料与关联阅读】
https://wia.org/ai-native-networks-and-the-implications-for-6g/
https://arxiv.org/abs/2411.06870
https://cacm.acm.org/blogcacm/what-lessons-can-we-learn-from-the-internet-for-ai-ml-evolution/
https://cacm.acm.org/blogcacm/the-continuum-of-network-architecture/
1336

被折叠的 条评论
为什么被折叠?



