pytorch中x = x.view(x.size(0), -1) 的理解

最新推荐文章于 2025-10-16 10:27:13 发布

原创最新推荐文章于 2025-10-16 10:27:13 发布 · 2w 阅读

106 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #view

pytorch 专栏收录该内容

11 篇文章

订阅专栏

本文详细解析了PyTorch中CNN代码常见操作x.view(x.size(0),-1)的功能与原理，解释了如何将卷积或池化后的多维张量转化为一维，以便连接全连接层，是理解并应用PyTorch CNN模型的关键。

部署运行你感兴趣的模型镜像

在pytorch的CNN代码中经常会看到

x.view(x.size(0), -1)

首先，在pytorch中的view()函数就是用来改变tensor的形状的，例如将2行3列的tensor变为1行6列，其中-1表示会自适应的调整剩余的维度

a = torch.Tensor(2,3)
print(a)
# tensor([[0.0000, 0.0000, 0.0000],
#        [0.0000, 0.0000, 0.0000]])
 
print(a.view(1,-1))
# tensor([[0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000]])

在CNN中卷积或者池化之后需要连接全连接层，所以需要把多维度的tensor展平成一维，x.view(x.size(0), -1)就实现的这个功能

def forward(self,x):
    x=self.pre(x)
    x=self.layer1(x)
    x=self.layer2(x)
    x=self.layer3(x)
    x=self.layer4(x)
        
    x=F.avg_pool2d(x,7)
    x=x.view(x.size(0),-1)
    return self.fc(x)

卷积或者池化之后的tensor的维度为(batchsize，channels，x，y)，其中x.size(0)指batchsize的值，最后通过x.view(x.size(0), -1)将tensor的结构转换为了(batchsize, channels*x*y)，即将（channels，x，y）拉直，然后就可以和fc层连接了

您可能感兴趣的与本文相关的镜像