研发为底、生态为径、AI为翼——全国一体化算力算网调度平台正式发布

文章介绍了GPU在AI、高性能计算、图形渲染等领域的广泛应用,以及英伟达如何通过CUDA和数据中心产品如DGX服务器打造其在算力市场的领先地位。英伟达的GPU业务快速增长,特别是在数据中心领域,其CUDA平台和强大的生态系统为开发者提供了便利。文章还提到国产厂商在AI芯片领域的布局和挑战,指出国产GPU公司如龙芯中科、海光信息和寒武纪的发展情况,以及大模型时代对算力需求的快速增长。

GPU | COMPUTEX | 算力 | GPU服务器

英伟达 | GH200 | 一体化算力算网调度平台

近年来,人工智能硬件、软件算法以及应用场景的丰富度不断增加,算法模型参数也不断增加,这带动了对数据中心并行计算算力的需求。因此,AI、高性能计算、图形渲染、大模型训练、AIGC、ChatGPT等推动GPU大算力并行计算芯片的需求。

2023年6月5日,由工业和信息化部主办,中国信息通信研究院(以下简称“中国信通院”)等承办的“算力创新发展高峰论坛”在京顺利召开。工业和信息化部信息通信发展司副司长赵策,中国信通院副院长王志勤等领导出席会议并致辞。会上,中国信通院联合中国电信共同发布我国首个实现多元异构算力调度的全国性平台——“全国一体化算力算网调度平台(1.0版)”

该平台汇聚通用算力、智能算力、高性能算力、边缘算力等多元算力资源,针对通用、智算、超算等不同客户的不同需求,设计异构资源池调度引擎,实现不同厂商的异构资源池的算力动态感知与作业智能分发调度。特别在AI训练作业调度流程中,作业可在智算资源池上进行训练推理,在通用算力资源池部署,从而实现跨资源池/跨架构/跨厂商的异构算力资源调度,目前已接入天翼云、华为云、阿里云等。

 

算力是 AI 芯片底层土壤,未来算力需求将呈爆发式增长。根据 IDC 数据,未来 5 年我国智能算力规模 CAGR 将达 52.3%。AI 芯片中,GPU 占据主要市场规模。根据 IDC 数据,2022 年国内人工智能芯片市场中,GPU 芯片所占市场份额达 89.0%。

研发实力是一家芯片设计公司的核心竞争力,英伟达从发展初期就重视研发生产力,以高投入换取高回报不断提升产品竞争力。2005 年,AMD 的研发费用为 11 亿美元,是英伟达的 3.2 倍左右。而到了 2022 年,英伟达的研发费用达到 73.4 亿美元,是 AMD 的 1.47 倍。

国产厂商加速布局,看好 AI 发展推动国产替代进程提速。在 ChatGPT 等概念影响下, AIGC 关注度火热。未来 AI 应用的落地离不开庞大算力的支撑,也将推动算力产业链快速增长。据 IDC数据显示,2021 年中国 AI 投资规模超 100 亿美元,2026 年将有望达到 267 亿美元,全球占比约 8.9%,排名第二,其中 AI 底层硬件市场占比将超过 AI 总投资规模的半数。

AI、高性能计算、图形渲染推动GPU芯片需求

随着人工智能、高性能计算、大规模图形渲染等应用场景的不断拓展和丰富,市场对大算力并行计算芯片的需求快速增长。截止目前,全球数据中心领域逻辑芯片市场规模已经超过400亿美元。同时,近期市场对国产GPU领域的关注度提升。基于英伟达的历史复盘,可以看出英伟达在图形渲染和数据中心领域保持较高的市场占有率,并实现产业引领。

一、AI 训练推理、复杂科学计算、大规模图形渲染等,持续推动并行计算芯片需求

由于GPU(图形处理器)是由成百上千个阵列排布的运算单元ALU组成,使得GPU更适用于大规模并发运算,其在图形处理、计算加速等领域有着广泛的运用。由于GPU加速器强大的并行处理能力,超算中心工作人员可以更好地设计深度网络结构,使得其在超算领域和数据中心领域更具经济效益,导致GPU在AI训练和推理、科学计算等领域有着广泛的应用。

在典型AI模型卷积网络中,大量数据以图片形式导入,在进行运算过程中,数据均为矩阵形式,而矩阵运算通常适合并行,因此AI算法的特性,使得GPU的运算速度明显大于CPU。科学计算将物理、化学、生物、航空航天等领域的问题转化为数学模型,通过计算和求解模型用于实际产业。从计算数据来看,由于科学计算中所用数据多数以矩阵为形式,同时由于科学计算对误差有强制要求,因此在运算中需要在并行运算基础上保证一定的精度。

而现代GPU在并行和矩阵运算的基础上,已经能够满足科学计算所需的精度要求。近些年来,随着人工智能软件算法的发展,复杂科学计算的进步,以及图形渲染功能的增加,带动底层芯片并行计算能力需求的快速提升。以全球AI芯片领军者英伟达的发展状况来看,公司AI芯片算力由2012年的4Tops提升至2021年的1248Tops,9年时间提升了约315倍。

 

英伟达单芯片推理性能(Int8 Tops)

二、AI 框架、并行计算框架等引入丰富,不断推动针对并行计算芯片软件开发门槛降低

随着AI框架和并行计算框架的引入和丰富,针对并行计算芯片软件开发门槛不断降低。从人工智能软件算法框架的发展历史来看,2015年谷歌宣布开源TensorFlow,2019年PFN宣布将研究方向由Chainer转向PyTorch。

目前,AI框架形成了TensorFlow和PyTorch双寡头垄断的竞争格局。其中,谷歌开源TensorFlow项目,在很大程度上降低了人工智能的开发门槛和难度。TensorFlow主要用于处理机器学习中的计算机视觉、推荐系统和自然语言处理(NLP)的模型训练和推理,涉及模型隐藏层相对较多,模型量相对较大,基本上均需要CUDA的加速处理。随着TensorFlow的开源,涉及到的开发者快速增加,CUDA软件下载量也呈现陡增趋势。据英伟达在2021GTC大会上宣布,截至2020年底,CUDA累计下载量超过2000万次,其中2020年下载量超过600万次。涉及到的开发人员约230万人(2020年新增超过60万人)。

人工智能框架发展史

三、算法丰富、算法复杂度提升等,亦成为市场需求的重要驱动力

近年来,随着人工智能芯片的不断发展,算法的丰富和复杂度的提升成为市场需求的重要驱动力。从Alexnet、ResNet到BERT网络模型,参数量已经超过了3亿规模,而GPT-3模型更是超过了百亿规模,Switch Transformer的问世更是一举突破了万亿规模。此外,英伟达在2020年发布的Megatron-LM模型,参数量达到了83亿,相比2018年震惊世界的BERT模型又提升了5倍。这种模型体积几何倍数的增长也带来了更多数据中心侧的需求,只有依靠上千块GPU并行运算才能在以天为单位的训练时长中完成对Transformer模型的训练。

深度学习初期模型越来越大

 

英伟达布局算力的成功之道

目前,全球GPU市场竞争格局主要由英伟达、AMD、英特尔等几家巨头厂商主导。英伟达是GPU市场的领导者,其市场份额在游戏领域高达80%以上,数据中心和人工智能领域也占据着重要地位。AMD是英伟达的主要竞争对手,其市场份额在游戏领域约为20%。英特尔则主要竞争于集成显卡和移动设备领域。这里以英伟达为例为大家展开详细介绍。

GPU 逐步成为全球大算力并行计算领域的主导者,这得益于 GPU 本身的优异特性以及英伟达等企业在芯片架构、软件生态等层面的不断努力,叠加 AI、高性能计算、大规模图形渲染等应用场景的快速崛起。在产品端,GPU 厂商亦结合下游的应用场景,在一个大的体系结构下,针对计算单元、缓存、总线带宽等技术点的优化和组合。目前最主流的应用场景产品是用于游戏等场景中图形渲染的显卡,以及用于数据中心 AI、高性能计算等场景的 GPGPU(通用计算 GPU)。

英伟达逐渐发展成为一家全球领先的高性能计算、AI 和游戏平台解决方案提供商。基于处理器、互连、软件、算法、系统和服务构建而成的计算平台,英伟达形成了数据中心、游戏、专业可视化、汽车四大类业务。

其中,数据中心业务主要指 NVIDIA 计算平台,覆盖超大规模、云、企业、公共部门和边缘数据中心,聚焦于加速最具计算密集型的工作负载(如人工智能、数据分析、图形和科学计算等)。游戏业务利用 GPU 和复杂的软件来增强游戏体验,使图形更加流畅、高质量。专业可视化业务主要通过 GPU 计算平台提高视觉设计领域的生产效率,主要包括设计和制造(包括计算机辅助设计、建筑设计、消费品制造、医疗仪器和航空航天)以及数字内容创作(包括专业视频编辑和后期制作、电影特效以及广播电视图形)两大应用场景。汽车业务主要包括自动驾驶、AI 驾驶舱、电动车计算平台和信息娱乐平台解决方案。公司推出的 DRIVE Hyperion 是一个完整的自动驾驶市场端到端解决方案,包含高性能、能效高的 DRIVE AGX 计算硬件、支持全自动驾驶能力的参考传感器组以及开放的模块化 DRIVE 软件平台,可在车辆内运行完整的感知、融合、规划和控制堆栈。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值