Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →triton.hyper.ai/
triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_shape, order)
返回指向父张量中 1 个块的指针。
参数**:**
- base - 父张量的基础指针。
- shape - 父张量的形状。
- strides - 父张量的步幅。
- offsets - 块的偏移量。
- block_shape - 块的形状。
- order - 原始数据格式的顺序。
434

被折叠的 条评论
为什么被折叠?



