作者 | 郭炜 白鲸开源 CEO,Apache 基金会成员
摘要:从技术架构的角度看,我认为这一次的AI浪潮将深刻影响整个软件生态。DSS 系统的设计是以人作为最终消费者的决策支持逻辑为中心,然而,随着 Agentic AI 时代来临,最终的“消费者”更可能是 agent,对数据仓库和复杂 ETL 链路将被重新设计,甚至消失。传统数据仓库偏重结构与查询模式,会被 Agentic Data Stack 架构强调语义与响应模式取代。
一、引言:Snowflake 换 CEO 背后的信号
2024 年春天,云数据仓库的明星公司 Snowflake 宣布换帅,前 Google 广告业务负责人 Sridhar Ramaswamy 接替了曾带领 Snowflake 实现 600 亿美元估值的传奇 CEO Frank Slootman。
如果你只是把这当成一次高管轮换,理解就不够透彻,因为这背后真正的隐喻是,数据仓库世界的范式,正在悄然巨变。
技术的演进,从来不是线性推进,而是技术的跃迁,从 OLTP 数据库到 MPP 数据仓库,从 MPP 本地化计算到向量化云数仓引擎,都是一个技术跃迁到另一个技术,从一个产品霸主到另一个产品霸主。
Slootman 是“数据仓库黄金时代”的代表。他押注云原生、押注多租户架构、押注 Snowflake 成为新一代数据平台的中枢,直接在市场上干掉了我从业的第一家公司——当年的数据仓库霸主 Teradata(从 102 亿美金市值到现在 20 亿美金市值)。就在他功成身退的这一刻,Snowflake 官方博客的关键词悄然切换:AI-first、Agent-driven、语义导向的数据架构。
这不是巧合,这是风向。
同一时间,硅谷最具前瞻性的风投们正在押注“Agentic AI”这个新概念:AI 不再只是一个模型,它是一个能感知、能行动、有目标、有协作能力的 Agent。
那么问题来了:
当 AI 不再只是“聊天工具”,而是能主动感知业务变化、理解意图并执行操作的智能体时,传统数据仓库这样的为“人”建造的决策支持系统还可以满足 Agent 的需要么?
数据仓库曾是企业的“重要的数据资产”,如今,却可能沦为 Agent 的“数据素材库”。甚至连“素材”这个词都在贬值,因为 Agentic DataStack 可以直接访问原始数据,并以语义+数据的形式直接供给给上层各类 Sales Agent,Risk Agent 直接使用;而数据仓库里无语义、冗余的数据只能留给传统 BI 和数据开发人员来消费。
真正危险的不是被淘汰,而是你还在运行上一代范式的规则,而世界已经换了剧本。
这不是对数仓的轻视,而是历史的轮回。正如当年 Hadoop、Iceberg 的崛起重构了数据湖,今天,Agentic AI 正在重写企业级的大数据架构。
二、1970-2024:数据仓库架构是如何演进的
1970:数据仓库之父:Bill Inmon
数据仓库之父 Bill Inmon 首次提出“面向主题、集成、时变、不可更新的数据集合”这一概念(EDW),奠定了后半个世纪企业数据架构的基石。
我本人也有幸在 20 多年前在北京大学的时候,在唐世谓教授带领下,学习并参与翻译《数据仓库》第一版,这本书里对主题域、数据分层架构和缓变维(历史拉链表)的描述,从上个世纪一直沿用到今天,成为整体数据仓库的奠基之作。

1983:Teradata 诞生,MPP 架构横空出世
1983 年诞生了未来 30 年横扫所有企业数据仓库基础设施的公司 Teradata,这也是我毕业后第一份工作所在的公司。首次将 MPP(大规模并行处理)架构引入数据处理系统,Teradata凭借软硬一体的基于 Bynet 的 MPP 架构,在超大量级数据处理和复杂 SQL 的情况下,比

最低0.47元/天 解锁文章
1635

被折叠的 条评论
为什么被折叠?



