TBE自定义算子有两种:
- DSL(Domain-Specific Language)
- TIK(Tensor Iterator Kernel)
其中DSL方式只需要定义算子的计算表达,不用考虑如何调度;
而TIK方式就需要同时定义计算与调度两方面。
所以DSL上手快,但性能可能不理想,适合初学者以及快速验证等场景;
TIK开发则需要了解SOC结构与特性,可以开发出更高性能的算子,适合对性能有一定要求的场景。
TBE自定义算子有两种:
其中DSL方式只需要定义算子的计算表达,不用考虑如何调度;
而TIK方式就需要同时定义计算与调度两方面。
所以DSL上手快,但性能可能不理想,适合初学者以及快速验证等场景;
TIK开发则需要了解SOC结构与特性,可以开发出更高性能的算子,适合对性能有一定要求的场景。
您可能感兴趣的与本文相关的镜像
Stable-Diffusion-3.5
Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率
702
1025
329

被折叠的 条评论
为什么被折叠?