torch.nn.Linear()

最新推荐文章于 2025-06-30 15:33:00 发布

转载最新推荐文章于 2025-06-30 15:33:00 发布 · 1w 阅读

Pytorch 专栏收录该内容

12 篇文章

订阅专栏

本文详细解析了PyTorch中线性层的工作原理，通过实例演示了如何使用torch.nn.Linear进行数据转换，解释了权重矩阵的形状及背后的数学运算，为深度学习初学者提供了清晰的理解路径。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import torch

x = torch.randn(128, 20) # 输入的维度是（128，20）
m = torch.nn.Linear(20, 30) # 20, 30是指维度
output = m(x)
print('m.weight.shape:\n', m.weight.shape)
print('m.bias.shape:\n', m.bias.shape)
print('output.shape:\n', output.shape)

m.weight.shape:
  torch.Size([30, 20])
m.bias.shape:
 torch.Size([30])
output.shape:
 torch.Size([128, 30])

为什么m.weight.shape=(30, 20)?

因为线性变换的公式是：
$y =xA^{T} + b$
先生成一个（30， 20）的weight，实际运算中再转置，这样就能和x做矩阵乘法了。

Reference:
https://blog.youkuaiyun.com/m0_37586991/article/details/87861418

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Vic_Hao

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch中torch.nn.Linear详解

03-23

780

神经网络常常需要进行线性变换操作，torch.nn.Linear就是一个十分常用的实现线性变换的方法之一。综上所述，torch.nn.Linear是PyTorch中极为常用的线性变换方法之一，通过定义输入数据和权重矩阵来实现。其中in_features是输入的特征数，out_features是输出的特征数，这两个参数是必须的。需要注意的是，当我们使用GPU进行训练时，我们需要把我们的数据和模型都移到GPU上。其中x是输入数据，A是权重矩阵，b是偏置项，y是输出结果。

torch.nn.Linear进行线性运算的流程

weixin_44347925的博客

12-23

1425

m = torch.nn.Linear(2, 4) m.weight #Out[2]: #Parameter containing: #tensor([[-0.6660, 0.1373], # [ 0.2986, 0.4758], # [-0.2398, 0.2945], # [-0.1975, 0.6900]], requires_grad=True) m.weight.shape #Out[21]: torch.Size([4, 2]) m.bias

1 条评论您还未登录，请先登录后发表或查看评论

torch之nn.Linear

Nicola.Zhang

08-22

8915

首先说明一点，nn.Linear为类，而不是函数，这在torch很是常见，不要想当然认为是C语言中； CLASS torch.nn.Linear(in_features, out_features, bias=True) 原理：矩阵相乘，和数学上的形式完全一致参数 in_features – size of each input sample out_features – size...

torch学习笔记(二) nn类结构-Linear

kyle1314608的博客

06-21

472

Linear 是module的子类，是参数化module的一种，与其名称一样，表示着一种线性变换。创建 parent 的init函数 Linear的创建需要两个参数，inputSize 和 outputSize inputSize：输入节点数 outputSize：输出节点数所以Linear 有7个字段: weight : Tensor ， outputSize ×× inp...

【Torch】nn.Linear算法详解

zkw54334的博客

06-30

539

nn.Linear是 PyTorch 中最基础的全连接（fully‐connected）线性层，也称仿射变换层（affine layer）。outputxWTboutputxWTb其中，WWW是形状为的权重矩阵，bbb是长度为的偏置向量。

torch.nn.Linear

weixin_44012667的博客

12-01

1107

是一个，通常用于神经网络中的输入、隐藏层或输出层。

torch.nn.Linear()函数的理解

热门推荐

哪惧明天，风高路斜

02-21

14万+

import torch x = torch.randn(128, 20) # 输入的维度是（128，20） m = torch.nn.Linear(20, 30) # 20,30是指维度 output = m(x) print('m.weight.shape:\n ', m.weight.shape) print('m.bias.shape:\n', m.bias.shape) print...

【pytorch】torch.nn.Linear详解

sazass的博客

03-18

6万+

在学习transformer时，遇到过非常频繁的nn.Linear()函数，这里对nn.Linear进行一个详解。参考：https://pytorch.org/docs/stable/_modules/torch/nn/modules/linear.html 概要 1. nn.Linear的原理:2. nn.Linear的使用:3. nn.Linear的源码定义:4. nn.Linear的官方源码: 1. nn.Linear的原理: 从名称就可以看出来，nn.Linear表示的是线性变换，原型就是初级数学

PyTorch里面的torch.nn.Parameter()详解

09-18

在PyTorch中，`torch.nn.Parameter()`是一个非常关键的类，它用于创建可学习的参数。这些参数通常是神经网络模型中的权重和偏置，它们在训练过程中会被优化算法更新以最小化损失函数。本文将深入探讨`torch.nn....

深入理解 `torch.nn.Linear`：维度变换的过程详解与实践（附图、公式、代码）

小蜗牛的珍贵百宝箱

09-27

2034

在创建: 输入的特征数量，即输入向量的维度。: 输出的特征数量，即输出向量的维度。# 创建线性变换层：从 4 维输入映射到 2 维输出在上述代码中，和表示输入是 4 维的，输出将被线性变换为 2 维。本文详细解析了 PyTorch 中模块的维度变换过程，通过公式、代码和图示帮助读者理解其内部机制。在实际的深度学习应用中，线性层是最基本也是最重要的组成部分之一。希望通过本文的讲解，你能够更深入地掌握的使用方法，并能在项目中灵活运用。

Pytorch 之torch.nn初探 torch.nn.Module与线性--Linear layers

weixin_50917576的博客

04-19

1309

神经网络可以使用torch.nn包构建。它提供了几乎所有与神经网络相关的功能，例如：线性图层 nn.Linear，nn.Bilinear 卷积层 nn.Conv1d，nn.Conv2d，nn.Conv3d，nn.ConvTranspose2d 非线性 nn.Sigmoid，nn.Tanh，nn.ReLU，nn.LeakyReLU 池化层 nn.MaxPool1d，nn.AveragePool2d Recurrent网络 nn.LSTM，nn.GRU 标准化 nn.BatchNorm2d ...

PyTorch----torch.nn.Linear()函数

xinxin的博客

03-26

505

在这个例子中，linear_layer表示一个具有5个输入特征和3个输出特征的完全连接层。我们通过这一层传递一批形状为(2,5)的输入数据，得到一个形状为(2,3)的输出张量(批大小为2,3个输出特征)。线性层的权重和偏置在层创建时自动初始化，并在训练过程中进行更新，以最小化损失。torch.nn.Linear是PyTorch中的一个模块，用于在神经网络中实现完全连接层。bias(可选):如果设置为True(默认)，层将学习一个附加的偏置项。它对应于输入张量中特征的个数。它对应于层中神经元的数量。

Pytorch实现线性模型

weixin_45982484的博客

10-02

856

1、模型训练步骤（1）准备数据集（2）设计模型，计算y_pred （3）计算loss （4）训练周期 ①前馈②反馈（梯度）③更新权重 2、知识点（1）线性单元（Linear Unit） ①线性单元就是计算一次y_pred，也就是一个感知机。 ②在实际的计算中，y_pred与X都是向量，而在pytorch里面使用Tensor进行向量的存储，因此在进行数据准备时需要将训练数据存储为Tensor。注：例如：w矩阵在扩充之前是1*1，那么在实际的计算中，需要将w扩充为31矩阵 ③w需要根据z与x来

torch_linear_regression

椰子奶糖的博客

09-07

446

torch_linear_regression 手打了一波linear_regression，再次体验了一下torch的流程 import torch import torch.nn as nn import numpy as np import matplotlib.pyplot as plt input_size = 1 output_size = 1 num_epochs = 60 learning_rate = 0.001 # Toy dataset x_train = np.array([

torch03：linear_regression

MachineLP的专栏

06-01

721

MachineLP的Github（欢迎follow）：https://github.com/MachineLP本小节使用torch搭建线性回归模型，训练和测试：（1）定义模型超参数：输入大小、输出、迭代次数、学习率。（2）定义训练数据：或者使用自己的数据集：（可参考：https://blog.csdn.net/u014365862/article/details/80506147）（3）定义模型。...

超级详细的torch.nn.Linear()函数讲解

qq_74087436的博客

07-09

9662

2.out_feature:该参数代表输出的最后一维的通道个数，就二维来说通俗来说就是Y矩阵的列数，因为Y是输出的参数，而Y维度为2，其最后一维就是列，所以out_feature在二维中就是矩阵Y的列数。1.in_fetaure:该参数代表输入的最后一维的通道个数，就二维来说通俗来说就是X矩阵的列数，因为X是输入的参数，而X维度为2，其最后一维就是列，所以in_feature在二维中就是矩阵X的列数。其中W是模型要学习的参数，W的维度为ixo，b是维度o的向量偏置。1.为什么w的维度是ixo呢？

torch.nn.Linear的维度变换过程详解（有图有公式有代码）

weixin_44115575的博客

08-05

4748

当初在学习nn.Linear时了解到的博客都是关于一维变换的，比如输入3通道，输出6通道；又比如得到（3，4，4）的特征图，需要进行拉平为（48，）的向量，然后通过nn.Linear（48，10）得到10个输出（分类任务很常见）。 nn.Linear除了可以进行分类，主要的作用就是改变维度便于下一个卷积层或线形层的输入。但是在实际代码中，nn.Linear的输入往往都是多维数据，一样可以正常输出。所以经过查阅手册和各个帖子，给出了自己的理解，作为笔记。

pytorch基础（五）：torch.nn.Linear的工作原理

一个bug是bug，多个bug能work

11-25

3106

文章目录前言一、吴恩达深度学习视频二、torch.nn.Linear 前言本系列主要是对pytorch基础知识学习的一个记录，尽量保持博客的更新进度和自己的学习进度。本人也处于学习阶段，博客中涉及到的知识可能存在某些问题，希望大家批评指正。另外，本博客中的有些内容基于吴恩达老师深度学习课程，我会尽量说明一下，但不敢保证全面。提示：以下是本篇文章正文内容，下面案例可供参考一、吴恩达深度学习视频相信很多人深度学习的入门教程是吴恩达老师的深度学习视频，吴恩达老师有关线性激活的运算推导相信大家

torch.nn.Linear返回值