真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

编辑部 整理自 MEET2026
量子位 | 公众号 QbitAI

“从算力集群、平台体系,到算电协同、国产化适配,再到产业级落地,AI基础设施正从‘资源供给’走向‘系统能力’。”

这是商汤大装置副总裁、CTO宣善明,在量子位MEET2026智能未来大会上关于商汤在AI Infra领域的最新进展分享。

他强调,真正面向大模型时代的AI Infra,不能只解决“有没有算力”,而要解决“算力如何高效、稳定、可规模化地支撑模型与产业”。

而这,正是商汤大装置过去几年持续演进的方向。

为了完整体现宣善明的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。

MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。

核心观点梳理

  • 目前商汤的战略是“1+X”,“1”即核心业务,包括大装置、大模型、AI应用三位一体;“X”即创新业务,包括智驾、医疗、零售等模块。

  • 大装置方面,商汤始终坚持自身优势,打造最懂大模型的AI Infra,依托多年的核心技术积累,目前算力总规模达32000P。

  • 商汤智算中心通过算电协同,削峰平谷,精准预测15分钟内算力对电力的消耗,已实现年化降低7%电费,实现年度碳减排超过3000吨,综合算效提升15%,同时模型预测准确率可达88%。

  • 商汤联合国内十余家厂商共同发布了“商汤大装置算力Mall”。在算力Mall上,客户能够使用自由组合和调配多样化的国产算力资源、平台工具和行业模型服务,同时在此基础上获得一个通用的、可无缝实现其算法的环境。

  • 商汤大装置不仅是要做一个算力平台,而是在框架、模型优化、推理加速等方面的全栈能力,全面赋能科研机构、互联网企业与AI创业团队等迭代模型、提升效率。

以下为演讲全文。

AI发展浪潮与商汤技术演进

大家好,我是商汤大装置的宣善明,非常荣幸能有机会跟大家做一次分享,分享商汤大装置在AI基础设施领域的最新实践,特别是在大模型时代的AI基础设施的一些深度演进以及行业落地的一些思考和成果。

我们首先回顾一下整个AI行业的发展脉络,从2011年的感知智能时代开始,深度学习和机器视觉,推动了一波AI创业浪潮,其中包括商汤在内的“CV四小龙“。

到2017年,随着Transformer架构流行起来,生成式AI催生了第二个发展周期。到最近几年,世界模型、空间智能的发展拉开了AI第三个阶段的发展进程,这也将是通向通用人工智能的关键路径。

商汤一直深度参与整个AI的浪潮,穿越了十年发展周期,从最开始的AI 1.0时代的城市感知、智驾感知、端侧感知以及工业感知等,这些我们都深度参与其中,在当年的CV和智慧城市领域积累深厚。

现在我们全身心投入原生多模态模型、时空模型、具身智能、世界模型这些方向,整体上,商汤一直在核心AI技术链条上持续演进。

这也给我们带来一个很好的天然优势,我们一直在做AI,我们的AI Infra也就是商汤大装置,是从支撑模型需求出发构建起来的,本质上是一个更适配大模型的AI基础设施。

不管是科研机构还是创业公司,在与商汤大装置合作过程当中,我们提供的不仅是一个简单的算力平台,其实是一个立体的能力体系,覆盖模型框架、模型优化、训练与推理体系、开发工具链等,基于我们在AI这个行业的沉淀是能够帮助到客户综合地去提升他们的能力。

现在商汤整个定位是“1+X”,1是核心业务,主要是“三位一体”的大装置、大模型和AI应用,商汤大装置是刚刚所提到的AI Infra,既支撑商汤自研模型,也服务行业模型平台。

商汤自研大模型也会坚持自己的优势以及定位,坚持多模态为主,而不仅是纯粹的LLM的语言模型。应用方面做了非常多的尝试,包括一些生产力工具、交互工具等,这些整体构成了核心业务。

在创新业务上,绝影做车舱以及智驾方向、医疗行业的善萃、硬件行业的元萝卜、零售方向的善惠等,以及我们在芯片行业也有非常大的投入,这些都在行业内得到了比较多的认可。

最懂大模型的AI Infra:商汤大装置的全栈体系与关键突破

商汤大装置坚持打造“最懂大模型的AI Infra”,我们是国内第一个做千卡集群的厂商,我们在2018年启动了千卡并行训练原型机研制项目,2019年建设了国内首个超大的智算中心-上海临港AIDC,截止到目前整体运营算力规模达到了32000P,各类训练与推理体系都经过产业级验证。

从沙利文、IDC这些头部机构的统计分析来看,最近这一两年,商汤大装置一直稳居第一梯队。

比如沙利文《2024年中国GenAI技术栈市场报告》显示,商汤大装置综合竞争力在国内是第一名,全球是第二名,仅次于亚马逊。

在市场表现方面,近期沙利文发布的《2025年H1中国全栈AI云服务市场报告》显示,商汤大装置凭整体市场份额位列中国全栈AI云服务市场第四,原生AI云厂商首位。

作为一个原生的AI Infra,商汤大装置具备“算力-平台-方案-服务”的端到端的能力体系。

算力层,包括多元异构算力、AI资源池、AI引擎等,平台方面具备模型广场、开发平台,支持模型开发者和创业团队高效研发和迭代。在方案上我们深入了多个典型行业与关键场景,通过场景化方案实现产业赋能。

另外,也提供一些专家服务、数据服务综合能力。因此,在我们客户看起来,商汤大装置不仅是算力平台,更具备了“懂AI、懂模型、懂行业”的全栈AI云能力体系。

下面,分享一些我们在推进基础设施演进方面的关键成果,一是AIDC算电协同实践,二是推动国产化适配

对于算力中心,我们会看到基础设施更底层的问题。

商汤临港AIDC是全国第一个5A级的智算中心,今年开始搭建了覆盖“源—网—荷—储”全链路的算电协同平台。

自研了能源大模型,与宁德时代联合建设了17.888MW/35.776MWh新型储能系统。

并联动SenseCore平台,将用户任务层、智能调度层、算力集群层全面贯通,同时联动服务器、制冷、供配电基础设施,并与储能系统和电网系统形成协同。

我们可以精准地预测15分钟之内算力对于电力的需求,通过智能控制储能系统实现削峰填谷。通过这样的方式,AIDC年度碳减排超过3000吨,年节电量突破1000万度,PUE达到了1.267,综合算效提升15%,这是非常好的典型案例,现在也在进行全国推广。

二是在推进国产化适配方面,我们今年联合了华为、海光、寒武纪、壁仞科技、摩尔线程等国内厂商,共同发布了商汤大装置的算力Mall,通过算力Mall,开发者和企业客户可以自由组合和调配多样化的算力资源、平台工具和行业模型服务,同时他们不是简单地使用这个芯片,在这个芯片基础可以非常无缝地实现他们的算法。

在算力基础上,我们提升了综合PaaS平台的能力,还提升了推理框架优化能力,也适配了各种国内外的主流大模型的训练和推理,适配了各种主流体系框架。

今年我们是首批完成与华为昇腾910C 384超节点全面适配的企业,在调度优化、系统稳定性以及故障恢复等方面提出多项行业创新,让多租户、大规模、弹性AI云服务成为可能。

其次,我们联合某头部客户进行了大规模异构混训,实现了5000张国产异构算力芯片的调度和纳管,算力的利用率能够达到80%,同时实现了持续一个月的稳定训练,这是在国产方面达到比较好的数据。

同时,我们近期和记忆张量一起落地了业界首个国产GPGPU PD分离商用推理集群,整体上,综合推理性价比能够达到同代NVIDIA A100的150%。

端到端能力推动AI在产业的深度落地

接下来讲一下我们在产业端的一些落地成果。

商汤大装置在行业方面,致力于推动业务沉到产业落地的各个环节中,让商汤成为产业端的AI基础设施供应商。我们在各行各业,包括像互联网科技、AIGC、传统行业、科研机构,以及到具身智能的一些赛道,我们都做了非常好的探索落地。

在互联网科技方面,有些互联网大厂自己本身也是云厂商,自己也是AI Infra厂商,但是他们的研究院很愿意直接找到商汤合作,因为我们提供的不只是云平台,我们在上面还提供了算力以外的能力,包含模型推理、模型优化、框架优化这样一些工作,包括专家服务、数据服务。所以我们体现的是一体化的AI能力优势。

AIGC这些公司类似于智象未来,会把模型放到我们平台做训练与推理优化。传统行业会做得更深一点,像南方电网、铁一院(中铁第一勘察设计院)等,我们会更深入业务场景,去理解用户在AI方面到底诉求是什么,是算力的诉求还是框架的诉求还是模型的诉求,我们都会提供一个完整的端到端的解决方案。

国家顶级的科研机构,像创智学院、上海人工智能实验室、清华大学、上海交大等都是商汤大装置比较重要的客户和合作伙伴。

在具身智能方面,我们也做到了市场唯一完整的端到端的方案,并服务了非常多具身智能初创公司。

以下是一些具体的合作案例。

这是一家头部的电商公司,我们连续三年为其服务,能够提供端到端的解决方案,不仅在算力层满足需求,也能在模型推理、模型优化等方面提供支撑。

传统行业像铁一院,我们合作打造了交通行业首个国铁勘察设计多模态大模型,这是在一个高度传统、工程体系复杂的行业,真正实现了这个行业模型落地。

同时,这也给了更多行业一个信心,即使是高度复杂的传统行业,AI也有可行之有效的落地路径。

以上是我今天的一些分享,希望可以让大家更清晰地了解商汤大装置作为原生AI Infra的定位,以及我们整个端到端的解决方案能力,希望我们帮助到更多行业和更多合作伙伴,欢迎大家跟我们做更多的交流,谢谢大家!

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值