
Ascend C
文章平均质量分 91
昇腾CANN
昇腾AI异构计算架构CANN,助力释放硬件澎湃算力!
展开
-
Ascend C算子性能优化实用技巧05——API使用优化
对于Matmul得到的结果矩阵C(m, n),若后续需要和GM上的矩阵D(m, n)进行Add操作,则可以在GetTensorC接口或者IterateAll接口的GM通路上,将enAtomic参数设为1,开启AtomicAdd累加操作,在搬出矩阵C到GM时,矩阵C的结果将直接累加到矩阵D的GM地址上,从而实现与矩阵D的Add操作。Counter模式下,只需要设置mask为所有参与计算的元素个数15000,然后直接调用Add指令,即可完成所有计算,不需要繁琐的主尾块计算,代码较为简练。原创 2024-11-15 14:39:19 · 1104 阅读 · 0 评论 -
上课了!老谭带你学习Ascend C,深入浅出,轻松掌握~
Ascend C课程全新上线,14节精讲课程让你全面掌握Ascend C!原创 2024-10-11 11:03:30 · 366 阅读 · 0 评论 -
基于Ascend C的Matmul算子性能优化最佳实践
Matmul算子实现的功能是矩阵乘法,通过Ascend C算子编程语言优化该算子的实现逻辑,可以使其在昇腾AI处理器上获得更优的执行性能。原创 2024-08-13 16:15:18 · 1595 阅读 · 0 评论 -
昇腾Ascend C编程入门教程(纯干货)
一文get昇腾Ascend C编程入门全部知识点,只需要了解C++编程、理解对列通信与内存申请释放机制、通过调用相应的计算接口与搬运接口,就可以高效写出运行在昇腾AI处理器上的高性能算子。原创 2023-08-27 22:50:08 · 1947 阅读 · 0 评论 -
Ascend C sqrt算子实战
编写一个Ascend C的sqrt算子,并通过内核调用方式在cpu和npu模式下进行验证。原创 2023-07-20 17:11:49 · 686 阅读 · 0 评论 -
Ascend C背后的魔法:深度理解多核并行/流水计算/dobule buffer技术
本文试图对Ascend C背后的多核并行,流水计算、dobule buffer编程技术进行摸索和理解,揭示是什么样的技术让用户编写的简单代码可以先实现上述神奇的功能,从而实现高性能算子。原创 2023-07-20 16:47:02 · 564 阅读 · 0 评论 -
3天上手Ascend C编程 | Day3 Ascend C算子调试调优方法
Ascend C提供孪生调试方法,即在cpu侧创建一个npu的模型并模拟它的计算行为,用来进行业务功能调试。相同的算子代码可以在cpu域调试精度,npu域调试性能。原创 2023-07-20 15:59:50 · 580 阅读 · 0 评论 -
3天上手Ascend C编程 | Day2 通过Ascend C编程范式实现一个算子实例
编程范式是算子实现的固定流程,基于Ascend C编程范式,可以快速搭建算子实现的代码框架。本文以一个实例为大家介绍如何基于Ascend C编程范式快速开发算子原创 2023-07-20 15:41:42 · 618 阅读 · 0 评论 -
3天上手Ascend C编程 | Day1 Ascend C基本概念及常用接口
Ascend C是华为昇腾面向算子开发场景的编程语言,想省时省力快速入门可以看这篇文章,为你系统化梳理AscendC编程最重要的知识点,3天快速上手不迷路。原创 2023-07-18 15:20:35 · 641 阅读 · 0 评论