Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →https://triton.hyper.ai/
triton.language.broadcast(input, other)
尝试将 2 个给定的块广播到 1 个共同兼容的形状。
参数:
- input (Block) - 第 1 个输入张量。
- other (Block) - 第 2 个输入张量。