pytorch torch.scatter_reduce函数介绍

PyTorch torch.scatter_reduce 函数

torch.scatter_reduce 是 PyTorch 中的一种高级操作,用于在特定维度上将源张量的值按索引归约到目标张量中。它结合了 scatter 和 reduce 操作,非常适合处理需要对特定索引进行归约(如求和、最大值等)的场景。


函数签名

torch.scatter_reduce(input, dim, index, src, reduce, *, include_self=True, out=None)

参数说明

  1. input:

    • 目标张量,表示归约操作的初始值。
  2. dim:

    • 指定在目标张量 input 中进行归约操作的维度。
  3. index:

    • 张量,表示目标张量中归约操作的索引位置。
    • index 的形状必须与 src 兼容,或者可以广播成 src 的形状。
  4. src:

    • 源张量,提供要归约到 input 中的值。
  5. reduce:

    • 指定归约操作的类型,支持以下选项:
      • "sum":按索引进行求和。
      • "prod":按索引进行乘积。
      • "mean":按索引计算平均值。
      • "amax":按索引取最大值。
      • "amin":按索引取最小值。
  6. include_self (可选, 默认 True):

    • 是否在归约时包括 input 中的原始值。
    • 如果为 False,只使用 src 中的值进行归约。
  7. out (可选):

    • 用于存储结果的张量。如果提供,将直接修改此张量。

返回值

返回一个张量,包含归约操作的结果,形状与 input 相同。


示例

1. 按索引求和 (reduce="sum")
import torch

input = torch.zeros(3, 5)
index = torch.tensor([[0, 1, 2, 0, 1],
                      [1, 2, 0, 1, 2]])
src = torch.tensor([[10., 20., 30., 40., 50.],
                    [1., 2., 3., 4., 5.]])

result = torch.scatter_reduce(input, dim=1, index=index, src=src, reduce="sum")
print(result)

输出

tensor([[50., 70., 30.,  0.,  0.],
        [ 3.,  5.,  7.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])
2. 按索引取最大值 (reduce="amax")
result = torch.scatter_reduce(input, dim=1, index=index, src=src, reduce="amax")
print(result)

输出

tensor([[40., 50., 30.,  0.,  0.],
        [ 3.,  4.,  5.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])
3. 使用 include_self=False
result = torch.scatter_reduce(input, dim=1, index=index, src=src, reduce="sum", include_self=False)
print(result)

输出:

tensor([[50., 70., 30.,  0.,  0.],
        [ 3.,  5.,  7.,  0.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])

注意事项

  1. index 范围

    • index 的值必须在 [0, input.shape[dim]) 范围内,否则会引发错误。
  2. 广播规则

    • index 和 src 必须具有相同的形状,或者可以通过广播匹配。
  3. 性能优化

    • torch.scatter_reduce 对于稀疏更新和归约非常高效,避免了循环操作。

应用场景

  • 聚合数据(如按索引分组求和或求最大值)。
  • 构造稀疏张量。
  • 实现自定义的归约操作(如图神经网络中的消息传递)。

`torch_scatter.scatter_max`函数PyTorch中的一种scatter函数,用于将输入的Tensor按照指定的维度进行散射操作,并返回指定维度上的元素最大值和对应的索引位置。 该函数的输入包括三个参数:输入Tensor(即要进行散射操作的Tensor)、散射维度dim和索引Tensor(即指定维度上的索引位置)。输出包括两个Tensor:散射后的Tensor和对应的最大值和索引位置。 具体来说,`torch_scatter.scatter_max`函数的操作流程如下: 1. 根据索引Tensor将输入Tensor按照指定维度进行散射操作,得到一个散射后的Tensor。 2. 在指定维度上找到散射后的Tensor中的最大值和对应的索引位置。 3. 返回散射后的Tensor和最大值和索引位置对应的两个Tensor。 值得注意的是,如果输入Tensor中某些元素在指定维度上对应的索引位置相同,那么在散射操作时,这些元素的最大值和索引位置会被更新为最后一个被处理到的元素的最大值和索引位置。 下面是一个简单的示例代码,演示了如何使用`torch_scatter.scatter_max`函数: ```python import torch from torch_scatter import scatter_max # 定义一个输入Tensor x = torch.tensor([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6], [0.7, 0.8, 0.9]]) # 定义一个索引Tensor index = torch.tensor([0, 1, 0]) # 在第一维上进行散射操作,得到散射后的Tensor和最大值和索引位置对应的两个Tensor out, argmax = scatter_max(x, index, dim=0) # 输出结果 print(out) # tensor([[0.7000, 0.8000, 0.9000], [0.4000, 0.5000, 0.6000]]) print(argmax) # tensor([2, 1]) ``` 在上面的示例代码中,我们首先定义了一个3x3的输入Tensor `x`,然后定义了一个长度为3的索引Tensor `index`,表示在第一维上,第一个元素要被散射到第0个位置,第二个元素要被散射到第1个位置,第三个元素要被散射到第0个位置。 之后我们调用`torch_scatter.scatter_max`函数,在第一维上进行散射操作,得到了散射后的Tensor `out`和最大值和索引位置对应的两个Tensor `argmax`。最后我们输出了这两个Tensor的值,可以看到在第一维上,第一个位置对应的最大值为0.7,索引为2,第二个位置对应的最大值为0.5,索引为1。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值