torch.copy_()函数介绍

最新推荐文章于 2024-11-20 10:13:50 发布

原创最新推荐文章于 2024-11-20 10:13:50 发布 · 5.4k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#copy_ #torch.copy_ #tensor.copy #拷贝

Pytorch 专栏收录该内容

77 篇文章

订阅专栏

本文详细讲解了PyTorch中tensor.copy_()函数的作用，强调其与直接赋值的内存管理差异，并通过实例演示了指定区域拷贝。重点在于优化内存使用和训练效率。

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

torch.copy_()函数进行tensor的复制。

Tensor.copy_(src, non_blocking=False) → Tensor

官网定义：Copies the elements from src into self tensor and returns self.

1）若采用直接赋值的方式，原来权重的存储指针会指向新得到的权重张量的存储区域；而使用 .copy_() 的话，仅仅是改变原来权重的值，存储区域则不发生改变。copy_()有利于降低运算。

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])
y = torch.rand((3,2)) # [0,1)之间均匀分布
print(y,id(y))
y = x #赋值操作，导致y的地址指向变了
print(y,id(y))

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])
y = torch.rand((3,2)) # [0,1)之间均匀分布
print(y,id(y))
y.copy_(x) # copy_()操作，y的地址指向没变，只是重新赋值。
print(y,id(y))

2）指定区域拷贝

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])

z = torch.rand((4,2))
z[:x.shape[0],:x.shape[1]].copy_(x) #只拷贝x的大小区域
print(z[:x.shape[0],:x.shape[1]].copy_(x))
print(z)

参考文章《【Pytorch 模型训练 Issue】tensor.copy_() 与直接赋值(=) 对训练耗时的影响 - 知乎

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理