点评Gartner全球AI平台魔力象限：火山引擎被赞，谷歌高过OpenAI-优快云博客

作者 | 高飞

刚看到Gartner发了首份《AI应用开发平台魔力象限》（Gartner MQ）（见图），读了一下，报告信息量还是不小的，翻译解读一下。

该图片来自火山引擎公众号，已获得火山引擎转载授权

先做个背景介绍。

Gartner MQ是什么？它从“落地能力”和“战略完整性”两个维度给全球厂商打分画象限，分成领导者、挑战者、远见者、利基玩家四个阵营。这套方法论可以追溯到1980年代，创始人Gideon Gartner最初只是在内部会议上用来做市场速览，1994年才正式对外发布。魔力象限是企业CIO等群体选型时参考权重很大的第三方报告之一，有上百个技术领域。

但是评价AI应用开发平台，可能是一个信号：全球大模型市场已经从“混战期“进入“分化期”，需要被正式排座次了。

10个要点

中国厂商存在感很强，火山引擎在挑战者象限的位置很亮眼

中国厂商在这份报告中表现突出，火山引擎、阿里云、腾讯云均入选挑战者象限。其中，火山引擎在该象限中“落地能力”得分最高；在“多模态应用开发能力”上，全球第四。

值得注意的是，这份报告的入选门槛极高：AI应用开发平台年营收至少1亿美元。这意味着很多知名的AI创业公司都被挡在门外。Cohere（企业级大模型明星公司）、CrewAI（Agent框架新锐）、Dify（开源LLMOps平台）均因营收未达标而落选。CoreWeave虽然入选，但因为刚完成对Weights & Biases的收购、整合尚未完成，被归入利基玩家。

换句话说，入选的厂商都是在和全球最成熟的玩家同台竞技。

我觉得可以补充的一个背景是，之前根据斯坦福大学HAI的2025年AI指数报告，在中国（83%）、印度尼西亚（80%）等亚洲国家，大多数民众认为人工智能产品和服务带来的好处多于危害。相比之下，在加拿大（40%）、美国（39%）和荷兰（36%）。也就是说，中国比美国高出44个百分点，这种乐观是是否是一种加持？

火山引擎不是传统云厂商，它是字节跳动的技术外溢

所以单独说一下火山引擎，揣测一下为什么火山引擎能在报告中拿到这个位置。

2020年火山引擎成立时，它的核心能力来自字节跳动在内容平台上的积累：推荐算法、高并发处理、视频编解码、A/B测试方法论。这些能力被产品化，对外输出给企业客户。

到了大模型时代，这种外溢也随之变化。豆包大模型本身就是字节跳动内部业务（豆包APP、抖音、飞书）的底座，火山方舟则是把这套AI基础设施开放给外部企业。所以火山引擎的逻辑始终是“内部先用、验证有效、再对外输出”。它不是从IaaS层往上打，而是从应用层往下延伸。这个基因决定了它天然懂：“如何让AI创造业务价值”，而不仅仅是“如何提供算力”。

这份报告的核心命题：模型强≠平台强

报告中，OpenAI是远见者，不是领导者。估计是很多人看报告会困惑的点。但是，我觉得其实一点都不奇怪。因为在我的印象中，OpenAI其实更像一个互联网公司，而非AI平台公司。印象中，山姆·奥特曼出来做访谈，常说DAU这些数字，而且也认命了消费业务CEO，还拉来苹果前首席设计师Ivy做消费硬件。

从开发者的角度，Anthropic的存在感早就强过OpenAI了。但是Anthropic并不在象限中。我想是因为虽然 Anthropic 提供了强大的 Claude 模型 API 和 Workbench（工作台），但在 Gartner 的评估周期内，Anthropic 更多被视为一家基础模型供应商（Model Vendor）。其主要的应用开发功能（如复杂的 RAG 编排、多模型路由、企业级治理）通常是依赖合作伙伴（如 AWS Bedrock 和 Google Vertex AI）来实现的，而不是通过 Anthropic 自身的独立平台提供的全栈服务。

继续说OpenAI，Gartner也提出，OpenAI的企业级支持结构比同类精简（没有正式的客户顾问委员会），缺乏混合云/私有化部署能力，且部分客户表示正在寻找替代平台。

换句话说，OpenAI “企业级开发平台”的味道也比较淡。但对财富500强的CIO来说，24/7专属支持、SLA保障、数据主权，这些“乏味”的东西比模型MMLU得分重要得多。

这个判断框架也适用于理解整份报告：Gartner评估的不是“谁的模型最聪明”，而是“谁能让企业把AI用起来”。

接下来说一下，四大领导者各有什么特点？

AWS的亮点是在Bedrock Guardrails中引入了“神经符号AI”的自动推理，用数学验证而非概率判断来对抗模型幻觉，号称准确率99%。这解决了金融、医疗等行业对确定性的刚需。

Google力推Agent2Agent协议，想成为AI智能体时代的“TCP/IP制定者”。如果未来不同厂商的智能体需要互相通信、协作，Google希望这个协议是标准。

微软的优势在于Azure AI Foundry的开发者体验，特别是Visual Studio Code的深度集成。但报告也指出，微软的很多重要发布基于OpenAI的技术，且在Gartner Peer Insights上的服务支持评分低于其他领导者。

IBM则走了一条“开放路线”，把所有Granite模型以Apache 2.0许可开源，并推出了开源的BeeAI智能体框架。感慨一下，IBM和微软真是从IT时代走过数字化转型时代，再到大模型时代，代表老牌公司的企业级底蕴。

四家领导者的共同点是：都在试图定义某种“标准”。AWS定义安全标准，Google定义协议标准，微软定义开发者体验标准，IBM定义开源标准。

火山引擎的技术护城河：一套解决“从模型到应用”的组合拳

再说回火山引擎，报告特别提到了火山引擎的三个核心产品：veRL、HiAgent、PromptPilot。

其实，这三个产品不是并列关系，而是一条完整的价值链：

veRL解决的是“模型怎么变聪明”。它是火山引擎开源的强化学习框架，让企业能够用自己的业务数据和目标函数，把通用大模型训练成懂行业的专用模型。

HiAgent解决的是“智能体怎么搭建”。它支持“意图驱动的智能体创建”，开发者用自然语言描述需求，比如“创建一个能根据用户位置推荐餐厅并完成预订的助手”，HiAgent能自动将其转化为可测试、可部署的服务。

PromptPilot解决的是“应用怎么调优”。它把提示词工程变成了一个正经的IDE，支持版本控制、A/B测试、效果对比。在AI应用里，提示词就是源代码，需要被严肃管理。

这套组合拳的逻辑是：先用veRL让模型具备行业能力，再用HiAgent快速搭建智能体应用，最后用PromptPilot持续优化效果。从模型层到应用层到运维层，全覆盖。

veRL：强化学习框架为什么是最硬核的一环

报告把RL作为一个相当的要点去提。

当然也很合理。毕竟AI竞争正在从“预训练”转向“后训练”。预训练给模型打基础，但要让模型真正具备复杂推理能力、理解业务目标，需要强化学习（RL）。

问题是，大规模RL训练是一项工程浩劫。需要同时维护Actor、Critic、Reward、Reference四个模型，频繁进行数据交换和状态同步。

veRL的核心论文HybridFlow被系统领域顶会EuroSys 2025接收。它的关键技术是3D-HybridEngine。在RL训练中，模型需要在“生成阶段”和“训练阶段”之间频繁切换，传统架构会产生大量显存冗余和通信开销。3D-HybridEngine通过高效的actor model resharding，消除了这种冗余，实现了SOTA级别的吞吐量。说人话就是：同样的GPU资源，veRL能比其他框架多训练好几倍的数据。

不过，虽然这个工具很不错，但对很多企业而言，到底是把资源投入到模型微调，还是上下文工程，应该是一个比较难抉择的题目吧。

永久授权，这一个容易被忽视的商业模式差异

再说到商业模式，火山方舟支持公有云SaaS、私有化部署，以及永久授权（Perpetual License）。

这在当前订阅制盛行的SaaS市场中是一个亮点。对于金融等偏好一次性资本支出（CapEx）而非长期运营支出（OpEx）的行业，永久授权是杀手锏。

另外，报告还提到，火山引擎的直销团队执行效率极高，平均交易闭环时间仅为数周。

相比于依赖漫长咨询流程的传统IT厂商，这种“短平快“的销售节奏反映了其产品的高标准化程度。（这也是互联网基因起作用吧）

火山引擎的行业版图，藏着字节跳动的底色

上边我们讲过，火山引擎是字节跳动的技术外溢而创立的，报告谈到，火山引擎增长最快的两个垂直领域是“科技公司（包括设备制造商和机器人）”和“零售电商”，也能体现这个基因。

科技硬件方面，机器人和智能硬件对网络延迟极其敏感，火山引擎在边缘计算和低延迟上的优势，结合其能够部署在端侧的模型能力，使其成为“具身智能”厂商的理想合作伙伴。据公开信息，全球Top10手机厂商有9家和火山引擎深度合作。

零售电商也是火山引擎的“主场”之一。它在电商推荐、智能客服、营销内容生成方面拥有实战经验。

利用veRL框架，零售企业可以训练出具备“推销技巧”的AI导购，而不仅仅是处理售后问题的客服。

此外，据火山引擎披露的数据，其在汽车行业覆盖超九成主流车企，在金融行业服务八成头部券商和系统重要性银行，在教育行业与超七成985高校达成合作。

飞轮效应：调用量、收入、产品三个维度的正向循环

除了Gartner这份报告，还有一些公开数据可以交叉验证这个领域市场飞轮效应的重要性。

IDC数据显示，2025上半年中国公有云大模型服务市场，火山引擎占49.2%份额。按此计算，中国公有云上每两个Tokens中有一个由火山引擎生产。

这里解释一个概念：大模型公有云服务市场。这个市场指的是企业通过云平台调用大模型API的服务。你不需要自己买GPU、自己部署模型，而是按调用量付费。这是目前大多数企业使用大模型的主流方式，也是AI商业化的一个核心战场。

所以：调用量大→业务场景丰富→模型迭代快→产品体验好→收入高→有资源持续投研发→调用量更大。从目前了解到的情况看，这种飞轮效应是火山引擎当前增长势能的核心来源。

深层信号：AI开发平台的竞争进入工程化阶段

最后，这份报告释放的核心信号是：大模型竞争已经从“拼参数”进入“拼工程”。

因为对AI行业落地而言，模型能力重要，但它是前提条件之一，而不是唯一的决胜因素。在模型能力趋于同质化的背景下，企业客户开始更关注：你的智能体框架是否完善？多模态交互是否稳定？能否过合规审查？成本能否算得过账？

这份Gartner报告本质上是在说：大模型时代的云计算格局正在被重塑。一些竞争发生在IaaS层，另一些竞争则发生在MaaS层。

对行业来说，这或许意味着“AI云“正在成为一个独立的赛道，而不是传统云计算的附属品。