AI算力革命:昇腾生态如何助力企业与科研“双轨加速”?

随着人工智能技术的快速发展,一方面,企业对高效、低成本的AI算力需求日益增长,另一方面,高校科研领域也在积极探索AI与传统科学的深度融合。从企业的智能化转型到科学研究的突破创新,底层技术的支撑与生态的完善成为关键因素。

在鲲鹏昇腾开发者大会(KADC 2025) 上, KADC会客厅邀请了清程极智联合创始人师天麾、清华大学付昊桓教授等专家,从企业应用、科研创新角度,分享昇腾生态的实践成果。

企业降本增效:FP4低精度推理加速库突破算力限制

作为昇腾生态的长期合作伙伴之一,清程极智致力于构建应用高效的智能算力系统,来帮助企业来部署大模型,给企业进行降本增效,适配更多的硬件来助力中国AI产业的发展。

据了解,清程极智开发的赤兔推理引擎和八卦炉训练系统已深度适配昇腾硬件,其中赤兔推理引擎于2025年3月正式开源,最大的特色是降低算力成本和使用门槛。“我们目前在做的一个工作就是会用软件的方法来实现 FP4、FP8这种低精度的浮点数,再做一些存储和计算的一些实时转换,这样就能把它的显存占用或者部署的算力门槛降低75%,原本要4台服务器才能跑671B满血版,现在只要一台服务器就能搞定,我们在MULE测试集上进行了测试,精度几乎是无损的,同时平均到单卡性能还有提升,在部分场景下吞吐可以有将近两倍的提升。”师天麾说。

在具体场景中,该技术已助力其他企业实现高效推理。师天麾介绍:“比如说我们的一家合作伙伴,也是一家清华系的公司,是做多模态视频训练推理的,有图片和视频的ToC、ToB用户,当时他们是出了一个图片相关的工作流,叫ComfyUI的应用工作流的图片推理。上线之前生成一张图片需要30秒,经过算法优化、系统优化等,跟我们进行联合优化后,图片生成工作流从30秒缩短至6-7秒,然后用户用得也很好,他们自己成本也降下来了,这就是我们推理引擎在多模态方面的一个应用。”

师天麾强调,与昇腾的合作关键在于生态互补:“华为提供底层算子库和编译驱动支持,我们负责上层并行计算优化,最终联合发布产品。”这一突破不仅提升单卡性能,部分场景吞吐量甚至翻倍,为中小企业低成本尝试AI提供了更多可能。

高校科研创新:AI+ 高性能计算融合破解气象预报难题

在高校科研领域,昇腾生态正推动AI与高性能计算的跨界融合。付昊桓教授以气象科学为例,指出传统数值模拟与AI结合的潜力。

“天气大家最核心的需求是希望有预报的能力。其实在预报能力这一块,我们现在就有一个比较大的空白,所以我们想看看能不能通过传统的高性能计算和新的AI的方法的结合,能够有一些突破,比如我们现在在做的一项工作,就是希望开发一个高性能计算和AI结合的一个模型,去帮我们的国家气象局做汛期的预报。我们每次提到数值模拟,它虽然是个传统方法,但是它很独特的优势,是基于科学家完全已经理解的数理方程来做的。”付昊桓说。

目前,付昊桓团队正探索用高性能计算+AI解决“季节尺度预报”这一世界难题,例如汛期预测,既需天气尺度的实时数据,又需气候尺度的长期规律,而AI与数值方法的互补或能填补行业空白。

付昊桓特别强调了生态对科研的重要性:“我觉得KADC这个会非常好!计算机硬件的发展很重要,但软件才能真正去体现它的意义和价值。软件和开发者生态如同打开数字世界的门,鲲鹏、昇腾通过高校课程、开发比赛等,让更多研究者加入,拓展更大的规模,才能让创新‘森林’结出更多果实。”

生态共建:降低门槛,加速产业智能化

两位专家一致认为,完善的生态是技术落地的关键。师天麾指出,昇腾开源的算子库极大降低了开发难度:“如Ascend C开放的融合算子库,帮助我们攻克了底层工程难题。”付昊桓则呼吁更多开发者参与:“生态的多样性决定了数字世界的规模,高校与企业的联动将催生更多突破。”

随着昇腾生态持续完善,从企业降本增效到科研范式革新,其底层支撑能力正推动AI技术普惠化。正如师天麾所言:“降低算力门槛,才能让企业快速试水AI,真正实现降本增效。”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值