TBE自定义算子有两种:
- DSL(Domain-Specific Language)
- TIK(Tensor Iterator Kernel)
其中DSL方式只需要定义算子的计算表达,不用考虑如何调度;
而TIK方式就需要同时定义计算与调度两方面。
所以DSL上手快,但性能可能不理想,适合初学者以及快速验证等场景;
TIK开发则需要了解SOC结构与特性,可以开发出更高性能的算子,适合对性能有一定要求的场景。
TBE自定义算子有两种:
其中DSL方式只需要定义算子的计算表达,不用考虑如何调度;
而TIK方式就需要同时定义计算与调度两方面。
所以DSL上手快,但性能可能不理想,适合初学者以及快速验证等场景;
TIK开发则需要了解SOC结构与特性,可以开发出更高性能的算子,适合对性能有一定要求的场景。