笔记｜TBE自定义算子开发（一）

最新推荐文章于 2025-11-04 19:56:13 发布

原创

最新推荐文章于 2025-11-04 19:56:13 发布 · 505 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#笔记

1 入门前相关知识

1.1 神经网络

为神经网络模型和数据提供了快速、高能效的计算资源，如CPU、GPU、TPU 和华为公司最新推出的昇腾AI处理器。

算子

深度学习算法由一个个计算单元组成，我们称这些计算单元为算子（Operator，简称Op）。在网络模型中，算子对应层中的计算逻辑，例如：卷积层（Convolution Layer）是一个算子；全连接层（Fully-connected Layer， FC layer）中的权值求和过程，是一个算子。

张量

张量（Tensor）是算子中的数据，包括输入数据和输出数据。

形状

张量的形状，( $D_1$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大壮爬坡

关注关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

深入解析CANN算子开发：TBE与AI CPU算子类型及其开发方法全指南

qq_38334677的博客

09-25

1081

TBE算子主要在AI Core上执行，用于处理与矩阵、向量和标量相关的计算任务。由于AI Core强大的并行计算能力，TBE算子在深度学习的推理和训练过程中，承担了大部分的计算密集型任务。TBE和AI CPU算子是CANN算子开发中的两个重要组成部分，各自针对不同的计算需求而设计。在AI加速场景中，选择适合的算子类型并通过合理的优化策略，能够大幅提升模型的推理与训练效率。

极智AI | 聊一聊昇腾 CANN TBE 算子开发方式

极智视界

10-04

1432

本文主要聊一聊华为昇腾 CANN TBE 开发方式。

参与评论您还未登录，请先登录后发表或查看评论

TBE自定义算子开发工具学习笔记

Stretch9776的博客

04-22

1958

TBE自定义算子开发工具学习笔记网课：视频地址 1 TBE基本概念 1.1 TBE基础知识 1.1.1 定义 TBE（Tensor Boost Engine）自定义算子开发工具：一款华为自研的 NPU算子开发工具在TVM（Tensor Virtual Machine）框架基础上扩展提供了一套Python API来实施开发活动学习建议： 1.2 TBE基本概念本章学习如下TBE中的基本概念： NPU、算子、TVM、DSL、HalideIR 1.2.1 NPU NPU 是神

CANN算子开发入门：基于TBE API编写第一个自定义算子

11-04

814

在CANN异构计算架构中，除了系统内置算子，开发者常需根据特定业务场景开发自定义算子。而TBE（Tensor Boost Engine）API作为CANN算子开发的核心工具，提供了从张量操作到硬件调度的完整能力。本文将以元素级乘法算子（Mul）为例，详细讲解基于TBE API开发自定义算子的全流程，帮助读者迈出算子开发的第一步。

TBE算子开发入门(Altas200I DK A2)

weixin_42140974的博客

12-20

706

最后一下添加/usr/bin/aarch64-linux-gnu-g++，构建工程，遇到无法找到头文件include “register/register.h” ，解决方法。本地部署成功，在Ascend-cann-toolkit安装目录/ascend-toolkit/latest/opp 中可以看到自定义算子包更新。用Mindstudio打开operator_demo_projects/aicpu_operator_sample工程，构建工程。在远端对应的文件下可以看到生成的文件，和算子库更新。

【CANN训练营第三季】TBE算子开发

kewei chen

01-07

1238

安装准备：https://www.hiascend.com/document/detail/zh/mindstudio/50RC3/instg/instg_000022.html。3、进行Sinh算子的功能调试，需要进行中间数据的验证以及结果数据的验证，使用默认误差。2、进行算子代码实现文件 "sinh.py"的开发，实现Sinh算子的计算逻辑。实现算子的如下交付件，并进行算子的ST测试，验证算子在昇腾AI处理器上执行是否成功。实现除“代码实现文件*.py”之外的剩余交付件，包含：【10分】

MindSpore框架TBE算子开发全流程

nyanyaxia的博客

11-01

2811

MindSpore框架下TBE算子开发全流程图文案例

TBE DSL开发方式实现Tensorflow BatchNorm算子开发全流程

white_boer的博客

05-16

1114

TBE DSL开发方式实现Tensorflow BatchNorm算子开发全流程本文使用MindStudio作为IDE,TBE DSL为开发方式实现的BatchNorm算子开发流程，对应bilibili视频链接：基于MindStudio和TBE DSL的Tensorflow BatchNorm算子开发_哔哩哔哩_bilibili使用MindStudio作为IDE，TBE DSL开发方式开发的Tensorflow BatchNorm算子。如若有疑惑，可进入昇腾官网，在昇腾论坛中技术提问与技术交流，附昇腾论

【2023 · CANN训练营第一季】昇腾AI入门课（Pytorch)——第一章学习笔记

qq_45257495的博客

04-16

2345

昇腾 AI 全栈可以分成四个大部分：1．应用使能层面，此层面通常包含用于部署模型的软硬件，例如 API 、 SDK 、部署平台，模型库等等。2. AI 框架层面，此层面包含用于构建模型的训练框架，例如华为的 MindSpore 、TensorFlow 、 Pytorch 等。3．异构计算架构，偏底层、偏通用的计算框架，用于针对上层 AI 框架的调用进行加速，力求向上支持多种 AI 框架，并在硬件上进行加速。

B站上华为 MDC 教学资料

xuke_2018的博客

08-07

2223

B站上华为 MDC 教学资料

PyTorch框架使用DSL进行TBE算子开发全流程

sandghost的博客

05-15

1517

PyTorch框架使用DSL进行TBE算子开发全流程 1. DSL算子基本概念介绍 1.1 什么是算子深度学习算法由一个个计算单元组成，我们称这些计算单元为算子（Operator，简称 OP）。在网络模型中，算子对应层中的计算逻辑，例如：卷积层（Convolution Layer）是一个算子；全连接层（Fully-connected Layer， FC layer）中的权值求和过程，是一个算子。对每一个独立的算子，用户需要编写算子描述文件，描述算子的整体逻辑、计算步骤以及相关硬件平台信息等。然后用深度

【CANN训练营】TBE DSL算子开发详解

qq_43280580的博客

01-05

654

【CANN训练营】TBE DSL算子开发详解

【CANN文档速递06期】初识TBE DSL算子开发

m0_71340392的博客

09-22

834

本期我们主要介绍较容易上手的DSL算子开发方式。

TBE算子的DSL开发方式

weixin_45668674的博客

11-22

331

视频

深入解析TBE及基于TVM的算子开发：昇腾AI处理器自定义算子设计全攻略

qq_38334677的博客

09-26

573

TBE全称为Tensor Boost Engine，是昇腾AI处理器的一部分，它直接负责在AI Core上执行算子。通过TBE，开发者可以利用TVM的编译栈，结合硬件特性进行深度优化，从而生成高效的算子。在AI的快速发展中，各类硬件加速器层出不穷，而不同的神经网络模型在这些平台上难以充分利用其计算性能。TBE通过基于TVM的灵活性和扩展性，为开发者提供了统一的接口，让模型可以在昇腾AI处理器上高效运行。

MindStudio制作MindSpore TBE算子（二）算子测试

weixin_44130162的博客

02-10

1752

在上一节中，成功制作了Mindspore的Add算子，具体可以查看，这一节，一起看看如何对算子进行测试。制作Mindspore的TBE流程中用于测试的是test_xxx_impl.py和xxx_case_timestation.json文件。

【华为微认证】基于昇腾AI处理器的算子开发知识点概括&考试解答

weixin_51711034的博客

02-06

4435

将开源框架的网络模型通过ATC转换成异腾AI处理器支持的离线模型实现算子调度的优化、权值数据重排、内存使用优化等可以脱离设备完成模型预处理

TBE单算子验证及调试

极客不撩妹

08-09

1780

TBE单算子验证及调试前言TBE单算子测试总体介绍TBE单算子测试的目的TBE测试工程介绍TBE单算子UT测试UT测试目的UT测试流程UT测试示例 ——以softmax_grad算子为例UT测试结果分析TBE单算子ST测试ST测试目的ST测试流程ST测试示例ST测试结果分析TBE单算子BBIT测试BBIT测试目的BBIT测试流程BBIT测试结果分析TBE单算子性能分析性能分析目的与流程性能分析测试示例性能分析结果分析总结前言 TBE单算子测试总体介绍 TBE单算子测试的目的算子程序能够跑通，场景覆盖全

专家系统TBE算子调优

Reeeeeeyh的博客

07-14

1029

专家系统TBE算子调优