自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 《深入理解 Ascend C:华为昇腾 AI 芯片的高性能编程语言》

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。

2025-12-17 10:20:13 1035

原创 《Ascend C 高级优化:GELU、LayerNorm 实现与算子融合实战》

将多个逻辑算子合并为一个物理 Kernel,中间结果不写回 GM,全程驻留 UB。框架不支持性能不达标(Profiling 确认瓶颈)需要特殊数值行为(如自定义量化)2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。

2025-12-16 18:12:02 903

原创 《深入昇腾底层:Ascend C 编程模型与高性能算子开发实战》

成为突破性能天花板的关键路径。而针对昇腾 NPU,Ascend C 正是华为官方推荐的底层开发工具。📌。

2025-12-16 18:08:53 892

原创 《Ascend C 性能优化实战:榨干昇腾 NPU 的每一分算力》

本文将超越基础教程,深入昇腾 NPU 的微架构细节,系统性地剖析 Ascend C 算子的性能瓶颈,并通过多个真实案例(矩阵乘、Softmax、LayerNorm)演示高级优化技巧,包括数据预取、计算与访存重叠、指令融合、Bank Conflict 规避等。随着 CANN 版本的不断演进,华为也在持续推出更高层次的优化工具,如 AoE(Ascend Optimizer Engine)自动调优,以及更加易用的 DSL(Domain Specific Language)。避免不必要的中间结果写回 UB。

2025-12-15 21:09:22 514

原创 《Ascend C 编程初探:从零构建你的第一个算子》

本文旨在为初次接触华为昇腾(Ascend)AI处理器和 Ascend C 编程模型的开发者提供一份详尽的入门指南。我们将深入浅出地解析 Ascend C 的核心设计理念、关键抽象(如 Queue、Pipe、GlobalTensor 等),并通过一个完整的、从环境搭建到编译部署的“向量加法”算子开发实例,带领读者亲手体验在昇腾 NPU 上进行高性能计算编程的全流程。无论你是 AI 框架开发者、算法工程师还是 HPC 爱好者,本文都将为你打开昇腾生态的大门。

2025-12-15 21:04:30 678

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除