
作者 | 高 飞
刚看到Gartner发了首份《AI应用开发平台魔力象限》(Gartner MQ)(见图),读了一下,报告信息量还是不小的,翻译解读一下。

该图片来自火山引擎公众号,已获得火山引擎转载授权
先做个背景介绍。
Gartner MQ是什么?它从“落地能力”和“战略完整性”两个维度给全球厂商打分画象限,分成领导者、挑战者、远见者、利基玩家四个阵营。这套方法论可以追溯到1980年代,创始人Gideon Gartner最初只是在内部会议上用来做市场速览,1994年才正式对外发布。魔力象限是企业CIO等群体选型时参考权重很大的第三方报告之一,有上百个技术领域。
但是评价AI应用开发平台,可能是一个信号:全球大模型市场已经从“混战期“进入“分化期”,需要被正式排座次了。
10个要点
1
中国厂商存在感很强,火山引擎在挑战者象限的位置很亮眼
中国厂商在这份报告中表现突出,火山引擎、阿里云、腾讯云均入选挑战者象限。其中,火山引擎在该象限中“落地能力”得分最高;在“多模态应用开发能力”上,全球第四。
值得注意的是,这份报告的入选门槛极高:AI应用开发平台年营收至少1亿美元。这意味着很多知名的AI创业公司都被挡在门外。Cohere(企业级大模型明星公司)、CrewAI(Agent框架新锐)、Dify(开源LLMOps平台)均因营收未达标而落选。CoreWeave虽然入选,但因为刚完成对Weights & Biases的收购、整合尚未完成,被归入利基玩家。
换句话说,入选的厂商都是在和全球最成熟的玩家同台竞技。
我觉得可以补充的一个背景是,之前根据斯坦福大学HAI的2025年AI指数报告,在中国(83%)、印度尼西亚(80%)等亚洲国家,大多数民众认为人工智能产品和服务带来的好处多于危害。相比之下,在加拿大(40%)、美国(39%)和荷兰(36%)。也就是说,中国比美国高出44个百分点,这种乐观是是否是一种加持?
2
火山引擎不是传统云厂商,它是字节跳动的技术外溢
所以单独说一下火山引擎,揣测一下为什么火山引擎能在报告中拿到这个位置。
2020年火山引擎成立时,它的核心能力来自字节跳动在内容平台上的积累:推荐算法、高并发处理、视频编解码、A/B测试方法论。这些能力被产品化,对外输出给企业客户。
到了大模型时代,这种外溢也随之变化。豆包大模型本身就是字节跳动内部业务(豆包APP、抖音、飞书)的底座,火山方舟则是把这套AI基础设施开放给外部企业。所以火山引擎的逻辑始终是“内部先用、验证有效、再对外输出”。它不是从IaaS层往上打,而是从应用层往下延伸。这个基因决定了它天然懂:“如何让AI创造业务价值”,而不仅仅是“如何提供算力”。
3
这份报告的核心命题:模型强≠平台强
报告中,OpenAI是远见者,不是领导者。估计是很多人看报告会困惑的点。但是,我觉得其实一点都不奇怪。因为在我的印象中,OpenAI其实更像一个互联网公司,而非AI平台公司。印象中,山姆·奥特曼出来做访谈,常说DAU这些数字,而且也认命了消费业务CEO,还拉来苹果前首席设计师Ivy做消费硬件。
从开发者的角度,Anthropic的存在感早就强过OpenAI了。但是Anthropic并不在象限中。我想是因为虽然 Anthropic 提供了强大的 Claude 模型 API 和 Workbench(工作台),但在 Gartner 的评估周期内,Anthropic 更多被视为一家基础模型供应商(Model Vendor)。其主要的应用开发功能(如复杂的 RAG 编排、多模型路由、企业级治理)通常是依赖合作伙伴(如 AWS Bedrock 和 Google Vertex AI)来实现的,而不是通过 Anthropic 自身的独立平台提供的全栈服务。
继续说OpenAI,Gartner也提出,OpenAI的企业级支持结构比同类精简(没有正式的客户顾问委员会),缺乏混合云/私有化部署能力,且部分客户表示正在寻找替代平台。
换句话说,OpenAI “企业级开发平台”的味道也比较淡。但对财富500强的CIO来说,24/7专属支持、SLA保障、数据主权,这些“乏味”的东西比模型MMLU得分重要得多。
这个判断框架也适用于理解整份报告:Gartner评估的不是“谁的模型最聪明”,而是“谁能让企业把AI用起来”。
4
接下来说一下,四大领导者各有什么特点?
AWS的亮点是在Bedrock Guardrails中引入了“神经符号AI”的自动推理,用数学验证而非概率判断来对抗模型幻觉,号称准确率99%。这解决了金融、医疗等行业对确定性的刚需。
Google力推Agent2Agent协议,想成为AI智能体时代的“TCP/IP制定者”。如果未来不同厂商的智能体需要互相通信、协作,Google希望这个协议是标准。
微软的优势在于Azure AI Foundry的开发者体验,特别是Visual Studio Code的深度集成。但报告也指出,微软的很多重要发布基于OpenAI的技术,且在Gartner Peer Insights上的服务支持评分低于其他领导者。
IBM则走了一条“开放路线”,把所有Granite模型以Apache 2.0许可开源,并推出了开源的BeeAI智能体框架。感慨一下,IBM和微软真是从IT时代走过数字化转型时代,再到大模型时代,代表老牌公司的企业级底蕴。
四家领导者的共同点是:都在试图定义某种“标准”。AWS定义安全标准,Google定义协议标准,微软定义开发者体验标准,IBM定义开源标准。
5
火山引擎的技术护城河:一套解决“从模型到应用”的组合拳
再说回火山引擎,报告特别提到了火山引擎的三个核心产品:veRL、HiAgent、PromptPilot。
其实,这三个产品不是并列关系,而是一条完整的价值链:
veRL解决的是“模型怎么变聪明”。它是火山引擎开源的强化学习框架,让企业能够用自己的业务数据和目标函数,把通用大模型训练成懂行业的专用模型。
HiAgent解决的是“智能体怎么搭建”。它支持“意图驱动的智能体创建”,开发者用自然语言描述需求,比如“创建一个能根据用户位置推荐餐厅并完成预订的助手”,HiAgent能自动将其转化为可测试、可部署的服务。
PromptPilot解决的是“应用怎么调优”。它把提示词工程变成了一个正经的IDE,支持版本控制、A/B测试、效果对比。在AI应用里,提示词就是源代码,需要被严肃管理。
这套组合拳的逻辑是:先用veRL让模型具备行业能力,再用HiAgent快速搭建智能体应用,最后用PromptPilot持续优化效果。从模型层到应用层到运维层,全覆盖。
6
veRL:强化学习框架为什么是最硬核的一环
报告把RL作为一个相当的要点去提。
当然也很合理。毕竟AI竞争正在从“预训练”转向“后训练”。预训练给模型打基础,但要让模型真正具备复杂推理能力、理解业务目标,需要强化学习(RL)。
问题是,大规模RL训练是一项工程浩劫。需要同时维护Actor、Critic、Reward、Reference四个模型,频繁进行数据交换和状态同步。
veRL的核心论文HybridFlow被系统领域顶会EuroSys 2025接收。它的关键技术是3D-HybridEngine。在RL训练中,模型需要在“生成阶段”和“训练阶段”之间频繁切换,传统架构会产生大量显存冗余和通信开销。3D-HybridEngine通过高效的actor model resharding,消除了这种冗余,实现了SOTA级别的吞吐量。说人话就是:同样的GPU资源,veRL能比其他框架多训练好几倍的数据。
不过,虽然这个工具很不错,但对很多企业而言,到底是把资源投入到模型微调,还是上下文工程,应该是一个比较难抉择的题目吧。
7
永久授权,这一个容易被忽视的商业模式差异
再说到商业模式,火山方舟支持公有云SaaS、私有化部署,以及永久授权(Perpetual License)。
这在当前订阅制盛行的SaaS市场中是一个亮点。对于金融等偏好一次性资本支出(CapEx)而非长期运营支出(OpEx)的行业,永久授权是杀手锏。
另外,报告还提到,火山引擎的直销团队执行效率极高,平均交易闭环时间仅为数周。
相比于依赖漫长咨询流程的传统IT厂商,这种“短平快“的销售节奏反映了其产品的高标准化程度。(这也是互联网基因起作用吧)
8
火山引擎的行业版图,藏着字节跳动的底色
上边我们讲过,火山引擎是字节跳动的技术外溢而创立的,报告谈到,火山引擎增长最快的两个垂直领域是“科技公司(包括设备制造商和机器人)”和“零售电商”,也能体现这个基因。
科技硬件方面,机器人和智能硬件对网络延迟极其敏感,火山引擎在边缘计算和低延迟上的优势,结合其能够部署在端侧的模型能力,使其成为“具身智能”厂商的理想合作伙伴。据公开信息,全球Top10手机厂商有9家和火山引擎深度合作。
零售电商也是火山引擎的“主场”之一。它在电商推荐、智能客服、营销内容生成方面拥有实战经验。
利用veRL框架,零售企业可以训练出具备“推销技巧”的AI导购,而不仅仅是处理售后问题的客服。
此外,据火山引擎披露的数据,其在汽车行业覆盖超九成主流车企,在金融行业服务八成头部券商和系统重要性银行,在教育行业与超七成985高校达成合作。
9
飞轮效应:调用量、收入、产品三个维度的正向循环
除了Gartner这份报告,还有一些公开数据可以交叉验证这个领域市场飞轮效应的重要性。
IDC数据显示,2025上半年中国公有云大模型服务市场,火山引擎占49.2%份额。按此计算,中国公有云上每两个Tokens中有一个由火山引擎生产。
这里解释一个概念:大模型公有云服务市场。这个市场指的是企业通过云平台调用大模型API的服务。你不需要自己买GPU、自己部署模型,而是按调用量付费。这是目前大多数企业使用大模型的主流方式,也是AI商业化的一个核心战场。
所以:调用量大→业务场景丰富→模型迭代快→产品体验好→收入高→有资源持续投研发→调用量更大。从目前了解到的情况看,这种飞轮效应是火山引擎当前增长势能的核心来源。
10
深层信号:AI开发平台的竞争进入工程化阶段
最后,这份报告释放的核心信号是:大模型竞争已经从“拼参数”进入“拼工程”。
因为对AI行业落地而言,模型能力重要,但它是前提条件之一,而不是唯一的决胜因素。在模型能力趋于同质化的背景下,企业客户开始更关注:你的智能体框架是否完善?多模态交互是否稳定?能否过合规审查?成本能否算得过账?
这份Gartner报告本质上是在说:大模型时代的云计算格局正在被重塑。一些竞争发生在IaaS层,另一些竞争则发生在MaaS层。
对行业来说,这或许意味着“AI云“正在成为一个独立的赛道,而不是传统云计算的附属品。

被折叠的 条评论
为什么被折叠?



