torch.max() x.item() x.sum() x.size(0) x.squeeze()

最新推荐文章于 2025-02-02 20:59:15 发布

原创

最新推荐文章于 2025-02-02 20:59:15 发布 · 3.0k 阅读

34 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch

本文详细介绍了PyTorch中的一些基本操作，包括如何使用torch.max()获取张量中的最大值及其索引，如何利用x.item()获取张量的数值，如何通过x.sum()计算张量元素的总和，以及如何运用x.size()来获取张量的形状信息，并介绍了x.squeeze()压缩张量的功能。

max item sum size squeeze

torch.max()
x.item()
x.sum()
x.size(0)
x.squeeze()

torch.max()

torch.max(a,0)或torch.max(a,1)
torch.max(a,0)返回行的最大值+最大值的索引
torch.max(a,1)返回列的最大值+最大值的索引在这里插入图片描述

参考博客

x.item()

x.item() →获取x的值只能是数值，不能是list
x必须是tensor 且只能是数值

x.sum()

x.sum() →计算x的总和
x是tensor
可以x.sum().item()连用，先求和再获取值

x.size(0)

x.size()返回张量tensor的shape
x.size(0)返回shape的第0维度
x.size(-1)返回shape的最后一个维度
在这里插入图片描述

import torch

yyy = torch.tensor(111)
print(yyy.size())
# print(yyy.size(0))  # 报错 因为没有shape
# print(yyy.size(-1)) # 报错

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

biggerbugger

关注关注

3
点赞
踩
34

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Pytorch快速入门系列---（二）动态计算图、自动微分、torch.nn模块

qq_42681787的博客

03-09

1444

由于卷积核尺寸远远小于输入尺寸，即减少需要学习的参数的数量，并且针对每个卷积层可以使用多个卷积核获取输入的特征映射，对数据具有很强的特征提取和表示能力，并且在卷积运算之后，使得卷积神经网络结构对输入的图像具有平移不变的性质。两种池化的区别如下图所示。由上面的函数图像可以看出，该函数的输出区间是（-1,1），整个函数是以0为中心，虽然Tanh函数曲线和Sigmoid函数的曲线形状比较相近，在输入很大或者很小时，梯度很小，不利于权重更新，但由于Tanh的取值输出以0对称，使用效果会比Sigmoid好很多。

【YOLOV5-5.x 源码解读】plots.py

qq_38253797的博客

08-02

3万+

目录前言0、导入需要的包和基本配置1、Colors2.1、plot_one_box 前言源码： YOLOv5源码. 导航: 【YOLOV5-5.0 源码讲解】整体项目文件导航. 这个文件都是一些画图函数，是一个工具类。 0、导入需要的包和基本配置 import glob # 仅支持部分通配符的文件搜索模块 import math # 数学公式模块 import os # 与操作系统进行交互的模块 from copy import copy # 提供通用的浅层和深层copy操作 from

3 条评论您还未登录，请先登录后发表或查看评论

Pytorch学习（一）：Variable / requires_grad / .item() / .max()函数/view_as函数 /.cpu()

ydy_2017211924的博客

08-05

742

Variable / requires_grad / .item() / .max()函数 requires_grad函数 Variable Variable的功能已经改变支持Variable(Tensor)和Variable(Tensor,requires_grad)两种，返回的是一个Tensor而非Variable值 .item() 返回Tensor类型的数字值，此Tensor只能有一个...

X SUM

lei_fly的博客

04-13

590

X SUM 是一类问题。

.item()函数用法

weixin_44543648的博客

05-27

3415

>>> x = torch.tensor([1.0]) >>>> x.item() 1.0 用来将tensor格式转化为python的数据类型格式。

Xsum问题总结

ysc6688的专栏

03-24

1171

LeetCode前面有好几题都是XSum，比如2Sum，3Sum，还有4Sum，刷的有点疲劳了。下面就总结一下吧。 2Sum最简单，先对数据进行排序，如果用STL的sort快排，时间复杂度为O(nlogn)，然后设置两个指针，一个初始化为数组的头，一个初始化在数组的尾，然后两边向中间扫描，如果当前两个指针指向的数的和正好是target，那么就保存当前数对（注意先入栈从头开始的那个指针的数值，后入

python: X.items()与X.item()的用法演示

fengbao24的博客

07-18

2382

python中items()函数与item()函数的用法演示

【YOLOV5-5.x 源码解读】common.py

热门推荐

qq_38253797的博客

08-24

3万+

目录前言0、导入需要的包和基本配置1、基本组件1.1、autopad1.2、Conv1.3、Focus1.4、Bottleneck1.5、BottleneckCSP1.6、C31.7、SPP1.8、Concat2、实验性结构2.1、前言源码： YOLOv5源码. 导航: 【YOLOV5-5.0 源码讲解】整体项目文件导航. 这个模块存放着yolov5网络搭建常见Common模块。 yolov5s网络结构图： 0、导入需要的包和基本配置 import math # 数学函数

【编译系列】Torch.compile()训练编译——算子融合逻辑 & 工程化

StarCap的博客

02-02

1467

从2.4版本开始，PyTorch开始支持通过torch.library的方式往torch.compile中注册新operator，对环境有一定要求torch>=2.4且gcc>=9(训练机器最高为8.2，需要手动安装)。<2.4版本也支持，但使用起来会比较繁琐。在训练场景下，要求实现operator对应的前向函数和反传函数。

torch.max()与torch.tensor()的用法

qq_43232545的博客

03-14

5264

torch.max() torch.max()简单来说是返回一个tensor中的最大值。例如： si=torch.randn(4,5) print(si) tensor([[ 1.1659, -1.5195, 0.0455, 1.7610, -0.2064], [-0.3443, 2.0483, 0.6303, 0.9475, 0.4364], [-1.5268, -1.0833, ...

碎片篇——Pytorch中.item()用法

姜一诚的博客

07-14

1513

【学习笔记】PyTorch中.item()用法

小羊羔子的BLOG

04-12

1589

官方文档解释.item()用法是：一个元素张量可以用x.item()得到元素值 Usetorch.Tensor.item()to get a Python number from a tensor containing a single value. item是得到一个元素张量里面的元素值如：查看x的类型： ...

对x.size()[0]的理解

dagewoshiwusong的博客

08-24

1万+

：最近在读一个程序，这个地方不大明白，遂自己写了一下看一下输出，并做一下记录，不然估计明天就忘记了，其实x.size()[0]这里的[0]就是表示维度。再比如：输出结果如上

x.view(x.size(0), -1)的用法

jie的博客

07-08

1524

出现在CoRRN中的MMDLoss中，例： x = x.view(x.size(0), x.size(2) * x.size(3)) y = y.view(y.size(0), y.size(2) * y.size(3)) x.view(x.size(0), -1)的用法：在CNN中，因为卷积或者池化之后需要连接全连接层，所以需要把多维度的tensor展平成一维，因此用它来实现具体解释：（参考） class NET(nn.Module): def __init__(self,batch

python中sum()函数详解

qq_46626684的博客

09-22

451

start不写则表示为0，在解释中中括号[,start]表示可选，所以在解释中没有写成sum(iterable,start)，而是在逗号前面加了中括号。可迭代元素可以是列表、元组、集合，但是不可以是int数据，但是start只能是int或者float型数据。不止这些，hhh，到处找也不知道啥意思，最后在报错代码帖子下面找到的。start表示统计结果从哪个数开始，并且统计结果要加上start。iterable表示可迭代对象，比如列表、元组、集合。只怪自己没理解书上写的，搞了大半天>_<

Pytorch-张量相加的四种方法 / .item()用法

weixin_36670529的博客

05-08

1万+

这里举例说明： x = torch.rand(5, 3) y = torch.rand(5, 3) #第一种 print(x + y) #第二种 print(torch.add(x, y)) #第三种 result = torch.empty(5, 3) torch.add(x, y, out=result) print(result) #第四种 y.add_(x) print(y) Any...

pytorch中：x = x.view(x.size(0),-1)的理解

u013925378的博客

12-03

2165

一般出现在model类的forward函数中，具体位置一般都是在调用分类器之前。分类器是一个简单的nn.Linear()结构，输入输出都是维度为一的值，x = x.view(x.size(0), -1) 这句话就是为了将前面多维度的tensor展平成一维。 x.size(0)指batchsize的值。x = x.view(x.size(0), -1)简化x = x.view(batchsize...

pytorch---之x = x.view(x.size(0), -1) 的理解

zxyhhjs2017的博客

09-21

3260

之前对于pytorch的网络编程学习都是大致理解每一层的概念，有些语法语句没有从原理上弄清楚，就比如标题的x = x.view(x.size(0), -1) 。这句话一般出现在model类的forward函数中，具体位置一般都是在调用分类器之前。分类器是一个简单的nn.Linear()结构，输入输出都是维度为一的值，x = x.view(x.size(0), -1) 这句话的出现就是为了将前面多...

x =x.view(x.size(0), -1)理解

weixin_45922730的博客

09-21

1299

x =x.view(x.size(0), -1)理解

train_acc += torch.sum(pre_label == b_y)

最新发布

09-25

<think> 我们遇到的问题是在训练过程中计算每个批次的准确率，使用以下代码： train_acc += torch.sum(pre_label == b_y) 然而，这里有几个需要注意的地方： 1. `pre_label` 和 `b_y` 应该是模型预测的标签和真实的标签。 2. `pre_label == b_y` 会返回一个布尔张量，其中对应位置相等为True，否则为False。 3. `torch.sum()` 会将True视为1，False视为0，从而得到这个批次中预测正确的样本数量。 4. 然后将其累加到 `train_acc` 中。但是，这里有一个常见的陷阱：`train_acc` 可能是一个标量（比如0维张量或Python数值），而每次加上的是一个整数（或0维张量）。这样在后续计算整个训练集的准确率时，我们需要除以总样本数。另外，需要注意的是，如果`pre_label`和`b_y`的形状不一致，可能会出错。通常，它们都应该是形状为`(batch_size,)`的一维张量。下面给出一个示例代码，展示如何在一个训练循环中计算准确率： ```python # 假设我们有一个训练循环 for epoch in range(epochs): train_acc = 0.0 # 每个epoch开始时重置为0 for batch_idx, (b_x, b_y) in enumerate(train_loader): # 将数据送到设备 b_x = b_x.to(device) b_y = b_y.to(device) # 前向传播 output = model(b_x) # 计算预测标签，例如分类问题中取最大概率的索引 pre_label = torch.argmax(output, dim=1) # 假设output的形状为(batch_size, num_classes) # 计算这个批次中预测正确的数量 correct_in_batch = torch.sum(pre_label == b_y).item() # 转为Python整数 train_acc += correct_in_batch # ... 后续进行反向传播和优化 # 计算整个训练集的准确率 epoch_train_acc = train_acc / len(train_loader.dataset) print(f'Epoch {epoch}, Training Accuracy: {epoch_train_acc:.4f}') ``` 注意事项： - 使用`.item()`将0维张量转换为Python数值，这样可以避免在累加时产生额外的张量（占用显存）。 - 每个epoch结束后，用累加的`train_acc`除以整个训练集的样本数（`len(train_loader.dataset)`）得到准确率。 - 如果数据集大小不能被批次大小整除，最后一个批次可能较小，但`len(train_loader.dataset)`是正确的总样本数。此外，如果是在GPU上运行，`pre_label == b_y`会在GPU上执行，然后通过`.item()`将结果取回CPU（因为`torch.sum()`返回的是0维张量），这样可以避免在CPU和GPU之间传输大量数据（因为这里只传输一个标量）。现在，根据我们的回答，我们需要提出3-5个相关问题。 §§相关问题§§ 1. 为什么在计算分类准确率时通常使用`torch.argmax`？ 2. 如果遇到`pre_label`和`b_y`形状不匹配的错误，可能的原因有哪些？ 3. 如何在PyTorch中同时计算一个批次的损失和准确率？ 4. 在训练过程中，除了准确率还有哪些常用的评估指标？ 5. 当使用数据并行训练时，准确率计算需要注意什么？ </think> ### PyTorch训练准确率计算详解 #### 代码解析与问题诊断在训练神经网络时，`train_acc += torch.sum(pre_label == b_y)` 是计算批次准确率的常见方法，但存在以下关键问题： ```python # 典型代码结构 pre_label = torch.argmax(logits, dim=1) # 获取预测标签 correct = (pre_label == b_y) # 比较预测值和真实标签 train_acc += torch.sum(correct) # 累积正确样本数 ``` **潜在问题分析：** 1. **数据类型不匹配**：`b_y` 需为长整型而非浮点型 2. **维度错误**：`pre_label` 和 `b_y` 维度必须一致 3. **设备不匹配**：两者必须在相同设备（CPU/GPU） 4. **梯度干扰**：计算过程可能影响梯度传播 #### 正确实现方案 ```python # 最佳实践代码 with torch.no_grad(): # 禁用梯度计算 # 确保数据类型和形状匹配 predictions = logits.argmax(dim=1) # [batch_size] targets = b_y.long().view_as(predictions) # 强制转换类型和形状 # 计算当前批次正确数量 batch_correct = (predictions == targets).sum().item() # 累积计算结果并转换类型 train_acc += batch_correct # 直接累加Python数值 ``` #### 关键要素说明 | **要素** | **正确做法** | **错误做法** | |----------|--------------|--------------| | 数据类型 | `torch.long` | `torch.float` | | 维度处理 | `view_as()` | 直接比较 | | 精度累计 | `.item()`转换 | 张量累加 | | 梯度控制 | `with torch.no_grad()` | 无保护 | | 设备同步 | `.to(device)` | 忽略设备 | #### 完整训练循环片段 ```python for epoch in range(epochs): train_acc = 0.0 for data, target in train_loader: data, target = data.to(device), target.to(device) optimizer.zero_grad() output = model(data) loss = criterion(output, target) loss.backward() optimizer.step() # 准确率计算（推荐方式） with torch.no_grad(): pred = output.argmax(dim=1) train_acc += (pred == target).sum().item() # 计算epoch准确率 epoch_acc = train_acc / len(train_loader.dataset) * 100 print(f'Epoch {epoch}: Accuracy {epoch_acc:.2f}%') ``` #### 常见错误解决方案 1. **类型不匹配错误** ```python # 修复方案 targets = b_y.type(torch.LongTensor).to(device) ``` 2. **维度不一致错误** ```python # 修复方案 if pred.dim() != targets.dim(): targets = targets.squeeze() # 或 unsqueeze() ``` 3. **设备不匹配错误** ```python # 修复方案 pred.to(device), targets.to(device) ``` > **重要建议**： > - 始终使用`.item()`转换标量值 > - 在验证阶段使用`model.eval()`模式 > - 大型数据集使用`float32`避免溢出