torch.gather的使用及理解

最新推荐文章于 2025-09-16 22:39:45 发布

原创最新推荐文章于 2025-09-16 22:39:45 发布 · 1.3k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #神经网络 #pytorch #python

本文详细介绍了PyTorch中gather函数的应用方法。通过创建一个2*3的张量并利用另一个张量作为索引，展示了如何沿指定维度收集元素。通过具体实例帮助读者更好地理解gather函数的工作原理。

结论：使用方法

# gather，沿dim指定的轴收集值。
y_hat.gather(1, y.view(-1, 1))# y.view(-1, 1)会变成一列，y_hat的取y作为的索引的值

分步理解：先创建一个2*3的tensor

>>y_hat = torch.tensor([[0.1, 0.3, 0.6], [0.3, 0.2, 0.5]])

tensor([[0.1000, 0.3000, 0.6000],
        [0.3000, 0.2000, 0.5000]])

为了使用gather函数，我们得创建一个tensor作为gather得参数

>>y = torch.LongTensor([0, 2])

tensor([0, 2])

我们需要把y变个形状

>>y.view(-1, 1)

tensor([[0],
        [2]])

先来看看使用得结果

>>y_hat.gather(1, y.view(-1, 1))
tensor([[0.1000],
        [0.5000]])

图解：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dlage

关注关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

pytorch - view函数实例详解

weixin_43560675的博客

09-04

1301

pytorch - view函数简而言之，view()函数改变对张量的观察角度即可以理解为改变维度。实例：例如 y=torch.randn(5,3) y是一个5×3的tensor ①y.view(15,1)：把 5×3的tensor → 15×1的tensor ②还有一个小细节：-1的用法 y是一个5×3的tensor y.view(-1,5) -1可以理解为未知数，表示这个维度不用计算，系统自己算出来=3 因为已知另外一个维度是5，5×3 / 5 = 3 只是直接写-1是不用人为计算罢了

torch.gather()使用解析

weixin_44715117的博客

08-05

4301

torch.gather使用解析

参与评论您还未登录，请先登录后发表或查看评论

pytorch中的gather函数_浅谈Pytorch中的torch.gather函数的含义

weixin_36467992的博客

12-24

225

pytorch中的gather函数pytorch比tensorflow更加编程友好，所以准备用pytorch试着做最近要做的一些实验。立个flag开始学习pytorch，新开一个分类整理学习pytorch中的一些踩到的泥坑。今天刚开始接触，读了一下documentation，写一个一开始每太搞懂的函数gatherb = torch.Tensor([[1,2,3],[4,5,6]])print bi...

torch.gather()解释与使用

a_145133的博客

04-25

557

具体而言，torch.gather(input, dim, index) 的作用是根据 dim 维度上的 index 索引值，从 input 张量中提取对应位置的数据，并组合成一个新的张量返回。其中，output 张量的第一行表示从 input 张量的第 0 行中提取了第 0 列和第 2 列的数据（即 [1, 3]），第二行表示从第 1 行中提取了第 1 列和第 3 列的数据（即 [6, 8]），第三行表示从第 2 行中提取了第 0 列和第 1 列的数据（即 [9, 10]）。例如，假设有一个形状为。

torch.gather

最新发布

平安喜乐

09-16

441

将index矩阵中的元素当成对input取值的行索引或者列索引，同时注意index矩阵中的元素值不能超过input的行或者列大小，比如dim=0，那么index中元素值不能超过input的列大小2，否则就会报错。

pytorch gather

pain_gain0的博客

09-18

468

y Out[34]: tensor([0, 2]) y_hat Out[35]: tensor([[0.1000, 0.3000, 0.6000], [0.3000, 0.2000, 0.5000]]) y_hat.gather(1, y.view(-1, 1)) 聚合方向y_hat的维度1，聚合位置： a[0][y.view(-1,1)[0]] = 0.1 a[1][...

.view(-1)理解

dagewoshiwusong的博客

09-03

1万+

Pytorch中torch.gather函数

12-21

`torch.gather`的使用关键在于理解索引张量`index`的作用。这个索引张量应与目标张量的某一维度大小相匹配，且它的每个元素指示了要从目标张量中提取的元素的位置。`dim`参数则决定了沿哪个维度进行索引，`dim=0`...

浅谈Pytorch中的torch.gather函数的含义

09-18

`torch.gather`的一个常见应用场景是在多分类任务中，当我们有一个one-hot编码的标签张量时，可以使用`torch.argmax`找到每个样本的预测类别，然后使用`torch.gather`来提取预测的正确类别。例如，如果你有一个形状...

【PyTorch】Torch.gather()用法详细图文解释

u013250861的博客

05-29

3042

使用函数的时候，涉及到3个Tensor及它们在这个函数中扮演的角色：input：输入（糖果区里等待被购买的各类糖果）index：索引（商场导购员）output：输出（来买糖果的人最终买走的某类糖果）另外还涉及到1个参数：dim：需要在input中使用index来“指路”的维度（选择糖果的范围）

【Pytorch数据处理】之Torch.index_select()、Torch.gather()详解

RachelLee6的博客

11-02

1455

【Pytorch数据处理】之Torch.index_select()、Torch.gather()详解

【Pytorch学习笔记】4.细讲Pytorch的gather函数是什么——从Softmax回归中交叉熵损失函数定义的角度讲述

takedachia的博客

04-08

1821

【Pytorch学习笔记】4.细讲Pytorch的gather函数是什么——从Softmax回归中交叉熵损失函数定义的角度讲述

TORCH.GATHER函数的简单理解

a2017082227的博客

05-16

207

版权声明：本文为weixin_44291388原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本声明。本文链接：torch.gather函数的简单理解_乾巽的博客-优快云博客_torch。gatherhttps://blog.csdn.net/weixin_44291388/article/details/104139447 pytorch官网关于torch.gather的文档:torch.gather — PyTorch 1.11.0 documentationht..

pytorch代码解析：loss = y_hat - y.view(y_hat.size())

集电极

12-08

1451

代码解析：pytorch中loss = y_hat - y.view(y_hat.size()) import torch y_hat = torch.tensor([[-0.0044], [-0.0015], [-0.0010], [-0.0053], [-0.0107], [ 0.0055], [-0.0073], [ 0.0070], [ 0.0041],

x = x.view(x.size(0), -1) 的理解

热门推荐

whut_ldz的博客

12-23

6万+

之前对于pytorch的网络编程学习都是大致理解每一层的概念，有些语法语句没有从原理上弄清楚，就比如标题的x = x.view(x.size(0), -1) 。这句话一般出现在model类的forward函数中，具体位置一般都是在调用分类器之前。分类器是一个简单的nn.Linear()结构，输入输出都是维度为一的值，x = x.view(x.size(0), -1) 这句话的出现就是为了将

PyTorch版《动手学深度学习》学习笔记 Task.1

zhencheng033的博客

02-13

274

Python yield Python yield和return的关系和区别：带yield的函数是一个生成器，而不是一个函数了，这个生成器有一个函数就是next函数，next就相当于“下一步”生成哪个数，这一次的next开始的地方是接着上一次的next停止的地方执行的，所以调用next的时候，生成器并不会从foo函数的开始执行，只是接着上一步停止的地方开始，然后遇到yield后，return出要生...

从头学pytorch(四)　softmax回归实现

山有山的高度，海有海的胸怀。

12-26

1587

FashionMNIST数据集共70000个样本,60000个train,10000个test．共计10种类别. 通过如下方式下载． mnist_train = torchvision.datasets.FashionMNIST(root='/home/sc/disk/keepgoing/learn_pytorch/Datasets/FashionMNIST', ...

torch.Tensor.view(*shape)方法的使用举例

敲代码的小风

12-18

1800

参考链接: view(*shape) 说明: 一句话概括,对一个连续的(contiguous)张量维度重新布局,但内存上不进行移动,仅仅返回一个视图. 在这里插入代码片

详解torch.view()的-1参数是什么意思

qq_43539854的博客

09-16

6770

torch.view() 如果你想改变一个 tensor 的大小或者形状，你可以使用torch.view。在pytorch中view函数的作用为重构张量的维度，相当于numpy中resize()的功能。view()返回的数据和传入的tensor一样，只是形状不同。 -1参数 -1在这里的意思是让电脑帮我们计算。 view()返回的tensor和传入的tensor共享内存。 ...

torch.gather 和repeat 搭配

03-21

### PyTorch 中 `torch.gather` 和 `repeat` 的搭配用法 #### 什么是 `torch.gather`？ `torch.gather` 是 PyTorch 中的一个操作，用于从输入张量的不同维度收集指定索引位置上的元素。它允许按照给定的索引来提取特定的数据片段。其基本语法为： ```python torch.gather(input, dim, index, out=None, sparse_grad=False) ``` 其中： - `input`: 输入张量。 - `dim`: 要沿着哪个维度进行聚集操作。 - `index`: 指定要采集的索引值，形状需与目标一致[^1]。 #### 什么是 `repeat` 或 `.expand()` 方法？ `.repeat()` 是一种扩展张量的方法，可以重复某个张量的内容以匹配新的形状。它的作用类似于 NumPy 的 `tile` 函数。对于简单的广播机制不足的情况，可以通过 `.repeat()` 来实现更复杂的形状调整。其基本语法为： ```python tensor.repeat(*sizes) ``` 参数 `*sizes` 表示各个维度上需要重复的次数[^2]。 --- #### 组合使用场景分析当我们将 `torch.gather` 和 `repeat` 结合起来时，通常是为了处理以下情况之一： 1. **动态索引选择并复制**：先通过 `gather` 收集某些特定数据，再利用 `repeat` 将这些数据沿某一维度扩展到更大的规模。 2. **批量操作中的灵活映射**：在批处理模式下，针对不同样本执行个性化的特征抽取或变换。下面是一个具体的例子展示如何组合这两个功能。 --- #### 使用案例假设有一个二维矩阵 A，以及一组对应每一行的最大值索引 B。我们需要根据索引 B 提取每行最大值，并将其扩展成一个新的三维张量 C。 ##### 示例代码 ```python import torch # 创建一个随机二维张量 A (batch_size=3, feature_dim=4) A = torch.tensor([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]], dtype=torch.float) # 假设我们知道每行的最大值对应的列索引 B = torch.tensor([3, 2, 1]) # shape: (batch_size,) -> [3, 2, 1] # Step 1: 使用 gather 获取每行的最大值 max_values_per_row = torch.gather(A, 1, B.unsqueeze(1)) # unsqueeze 使 B 变为 (batch_size, 1) print("Max values per row:", max_values_per_row.squeeze()) # Output: tensor([4., 7., 10.]) # Step 2: 扩展结果至更高维空间 C = max_values_per_row.expand(-1, 4).unsqueeze(2) # expand 到 (batch_size, 4), 并增加一维变为 (batch_size, 4, 1) D = C.repeat(1, 1, 3) # 进一步 repeat 成 (batch_size, 4, 3) print(D.shape) # 输出应为 torch.Size([3, 4, 3]) ``` 上述代码展示了如何结合 `torch.gather` 和 `repeat` 完成复杂的数据转换任务。这里的关键在于理解 `gather` 如何定位所需数据，以及 `repeat` 怎样改变张量结构[^3]。 --- #### 注意事项 1. 当调用 `gather` 时，确保索引张量 (`index`) 的尺寸与目标维度相兼容。 2. 对于高阶张量的操作，务必注意各维度的意义及其顺序关系。 3. 如果涉及 GPU 计算，请确认所有参与运算的对象均位于同一设备之上[^4]。 ---