pytorch系列 ---5以 linear_regression为例讲解神经网络实现基本步骤以及解读nn.Linear函数

原创

于 2018-11-09 09:42:43 发布 · 2.9w 阅读

CC 4.0 BY-SA版权

文章标签：

本文详细解读了PyTorch中nn.Linear的源码，阐述了神经网络实现的基本步骤，并通过线性回归模型的训练过程，展示了损失函数随迭代变化的情况。

本文主要讲述最简单的线性回归函数：
$y = w x + b$ 在pytorch的实现，主要包括神经网络实现的基本步骤和nn.Linear的源码解读。

Linear继承于nn.Module,内部函数主要有__init__，reset_parameters, forward和extra_repr函数

在这里插入图片描述

接下来看一下，输入该网络层的形状(N, *, in_features)，其中N为批量处理过成中每批数据的数量，*表示，单个样本数据中间可以包含很多维度，但是单个数据的最后一个维度的形状一定是in_features.

经过该网络输出的形状为(N, *, out_features),其中计算过程为：

$N, *, in\_{features}] * {[out\_{features }, in\_{features}]}^T = [N, *, out\_{features}]$

15 条评论

彬※彬有礼 2021.07.20
你好大佬，谢谢你的分享！即是说linear层初始生成的权重矩阵可以学习吗？（训练线性层是否是训练这个权重矩阵呢）
- 彬※彬有礼回复litchi&&mango 2021.08.03
  谢谢大佬
- litchi&&mango回复彬※彬有礼 2021.07.27
  我猜你是想得到训练好的权重吗？pytorch里可以保存加载好的模型以及各种参数，包括权重矩阵

Qitanium 2020.05.03
一个小问题:epoch应该是把样本全部训练一遍吧....这样的话应该一个epoch要进行n次sgd（n是样本总数？）
- yjcsyjcs1回复Qitanium 2020.07.25
  [reply]qq_44310821[/reply]应该是一次，有.step逐层更新反向传播的梯度

来碗热干面 2018.12.21
[N,∗,in_features]∗[out_features,in_features] T=[N,∗,out_features] 写错了
- 墨氲回复来碗热干面 2018.12.21
  [reply]weixin_40161953[/reply] 谢谢了，已改正了