expand，where和softmax算子的cuda编程

谨慎付费（看不懂试读博客不要订阅）

已于 2023-09-02 21:28:43 修改

阅读量667

点赞数

分类专栏：高性能计算文章标签：算法

于 2023-08-31 20:10:46 首次发布

本文链接：https://blog.youkuaiyun.com/forrestguang/article/details/132610196

版权

高性能计算专栏收录该内容

54 篇文章 ¥239.90 ¥399.90

订阅专栏

本文介绍了PyTorch中的expand和where算子的CUDA编程，包括1D和高维情况下的实现。文章详细阐述了如何在高维数组上应用expand，解析了如何根据输出索引回溯输入向量索引。此外，还讨论了一维数组下的softmax算子，分析了不同规约策略如交叉配对、交错配对和shuffle warp的并行加速效果，并给出了相应的CUDA代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

expand和where介绍

当谈到 Torch 中的 expand 函数时，我们实际上是指 PyTorch（Torch 的 Python 接口）中的 expand 方法。下面是对 expand 方法和 where 函数的介绍，包括它们的输入和输出：
expand 方法：
torch.Tensor.expand() 是 PyTorch 中 Tensor 类的一个方法，用于扩展张量的维度。
输入：input 是要扩展的张量，size 是一个元组，指定了要扩展的每个维度的大小。
输出：返回一个新的张量，形状是 input 张量的形状扩展后的形状。
where 函数：
torch.where() 是 PyTorch 中的一个函数，用于根据给定的条件从两个张量中选择元素。
输入：condition 是一个布尔型的张量，形状与 x 和 y 两个张量的形状一致。x 和 y 是两个形状相同的张量。
输出：返回一个新的张量，形状与 x 和 y 的形状相同，其中的元素根据 condition 张量的值选择自 x 或 y。