【pytorch】scatter的使用

作用

scatter是“散开”的意思,顾名思义,是将一个Tensor按照index做分散。

形式

在pytorch中,scatter可以通过torch.scattertorch.scatter_(修改自身数据),或者Tensor自生就有的方法scatter

Tensor.scatter_(dim, index, src, reduce=None) → Tensor

参数

  1. input
    输入参数,如果是通过Tensor直接调用的,没有该参数(就是自身嘛),仅仅在torch.scatter/torch.scatter_中需要指定

  2. dim
    维度,需要用于在哪一个维度

  3. index
    为Tensor做scatter时需要的索引,注意,这个index必须是int64型。另外它的-1维必须与input的-1维一致。

  4. src
    用于“分散”的源数据,它的shape必须与input的shape一致
    它将用于具体的计算,公式如下
    计算方法

  5. value
    一个0-1.0之间的float数,它与src只要一个即可。如果指定了value,则按照value这个值去填充index指定的位置。

使用样例

一维数据

input = torch.zeros(3)
index = torch.LongTensor([0,2,1])
input = input.scatter(dim=0, index=index, src=torch.Tensor([10,20,30]))
print(input)

输出结果为,

tensor([10., 30., 20.])

怎么的出来的呢?
套用公式如下:
self[index[i]] = src[i]
则有

input[index[0]] = src[0]     =>   input[0] = 10
input[index[1]] = src[1]     =>   input[2] = 20
input[index[2]] = src[2]     =>   input[1] = 30

一维数据,重复index

input = torch.zeros(3)
index = torch.LongTensor([0,2,0])
input = input.scatter(dim=0, index=index, src=torch.Tensor([10,20,30]))
print(input)

结果为

tensor([30.,  0., 20.])

计算如下:

input[index[0]] = src[0]     =>   input[0] = 10
input[index[1]] = src[1]     =>   input[2] = 20
input[index[2]] = src[2]     =>   input[0] = 30   /*override here*/

一维数据,使用value

input = torch.zeros(3)
index = torch.LongTensor([0,2])
input = input.scatter(dim=0, index=index, value=0.999)
print(input)

结果如下

tensor([0.9990, 0.0000, 0.9990])

运算过程同上面例子,这里不再赘述

二维数据

x = torch.zeros(2,4)
index = torch.LongTensor([1,0,2,3]).reshape(1,4)
x = x.scatter(dim=1, index=index, src=torch.Tensor([10,20,30,40,50,60,70,80]).reshape(2,4))
print(x)

这个例子里,index是(1,4),而input是(2,4),这样仅仅针对第一"行"做scatter。
结果如下

tensor([[20., 10., 30., 40.],
        [ 0.,  0.,  0.,  0.]])

计算过程如下:

# row 0
input[0,index[0]] = src[0][0]     =>   input[0][1] = 10
input[0,index[1]] = src[0][1]     =>   input[0][0] = 20
input[0,index[2]] = src[0][1]     =>   input[0][2] = 30
input[0,index[3]] = src[0][1]     =>   input[0][3] = 40
# row 1
input[1,index[0]] = src[1][0]     =>   input[1][1] = 0
input[1,index[1]] = src[1][1]     =>   input[1][0] = 0
input[1,index[2]] = src[1][1]     =>   input[1][2] = 0
input[1,index[3]] = src[1][1]     =>   input[1][3] = 0
PyTorch Scatter是一个用于在PyTorch张量上执行scatter操作的库。scatter操作是指将输入张量的值散布到输出张量的指定位置。这个库提供了各种scatter操作,包括根据给定索引在张量上散布值、按照给定形状散布张量的值等等。 例如,使用PyTorch Scatter可以将一个大小为[batch_size, num_nodes, embedding_dim]的节点嵌入张量散布到一个大小为[batch_size, num_edges, embedding_dim]的边嵌入张量中。这可以通过使用边索引张量来实现,其中每一行包含两个节点的索引,表示这两个节点之间存在一条边。 下面是一个使用PyTorch Scatter进行scatter操作的示例: ```python import torch from torch_scatter import scatter_mean # 创建一个大小为[8, 10, 32]的张量 x = torch.randn(8, 10, 32) # 创建一个大小为[8, 10]的索引张量 index = torch.tensor([[0, 1, 2, 2, 3, 4, 4, 5, 5, 5], [0, 1, 2, 3, 3, 4, 5, 5, 6, 7]]) # 在第一维上按照索引张量散布平均值 out = scatter_mean(x, index, dim=1) print(out.shape) # 输出:torch.Size([8, 8, 32]) ``` 这个例子中,我们使用scatter_mean函数将大小为[8, 10, 32]的张量中第一维的值根据大小为[8, 10]的索引张量散布到一个大小为[8, 8, 32]的输出张量中。具体来说,对于每个索引张量中的行,函数将对应行在输入张量中的值取平均值,并将结果放置在输出张量的对应位置。结果是一个大小为[8, 8, 32]的张量,其中每个元素表示输入张量中某些节点嵌入的平均值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值