Torch7学习（六）——学习神经网络包的用法（4）——利用optim进行训练

最新推荐文章于 2025-07-15 09:44:53 发布

原创

最新推荐文章于 2025-07-15 09:44:53 发布 · 6.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #torch #深度学习 #lua

本文是Torch7学习系列的最后一部分，重点介绍如何使用optim包进行神经网络的自动优化训练。通过optim.sgd函数，结合学习率、衰减率、权重衰减和动量等配置，实现网络参数的有效更新。

torch7学习（一）——Tensor
Torch7学习(二) —— Torch与Matlab的语法对比
 Torch7学习（三）——学习神经网络包的用法（1）
Torch7学习（四）——学习神经网络包的用法（2）
Torch7学习（五）——学习神经网路包的用法（3）
Torch7学习（六）——学习神经网络包的用法（4）——利用optim进行训练
 Torch7学习（七）——从neural-style代码中看自定义重载函数的训练方式

总说

这篇博客是本系列的最后一篇，着重讲如何利用optim包进行自动挡训练。

-- standard training code
-- Here let's train XOR net.

require 'torch'
require 'cunn'
require 'cutorch'
require 'nn'
require

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hungryof

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch深度学习实战（3）——使用PyTorch构建神经网络

盼小辉丶的博客

06-13

8万+

PyTorch 是一个用于构建深度神经网络的库，具有灵活性和可扩展性，可以轻松自定义模型。在本节中，我们将使用 PyTorch 库构建神经网络，利用张量对象操作和梯度值计算更新网络权重，并利用 Sequential 类简化网络构建过程，最后还介绍了如何使用 save、load 方法保存和加载模型，以节省模型训练时间。

PyTorch深度学习实战（7）——批大小对神经网络训练的影响

热门推荐

盼小辉丶的博客

07-31

1万+

在神经网络中，批( batch )是指一次输入网络进行训练或推断的一组样本。批处理( batch processing )是指将这一组样本同时输入网络进行计算的操作。本节中首先介绍批( Batch )的基本概念，并且介绍批大小在神经网络训练过程中的影响。

1 条评论您还未登录，请先登录后发表或查看评论

这个 R 包厉害了！可以在 R 语言构建多种神经网络模型，连图像分割这种复杂任务也可以完成（Rtorch教程示例）

weixin_49214410的博客

02-16

1204

生信碱移Rtorch经典的统计方法和简单的回归模型在面对复杂的非线性问题时，往往难以有效捕捉数据中的深层次特征。深度学习能够从数据中自动学习特征并进行复杂模式的建模，特别是在图像识别、自然语言处理和基因组学等领域表现卓越。▲ 关于神经网络的易懂讲解，可以点击此处蓝字查看小编的另一篇文章。尽管如此，生信用户最常使用的代码框架是 R 语言，而当前的主流神经网络框架 (如PyTorch) 大多基于 Python，这难免会存在一些学习成本。Rtorch 包针对这种情况而被设计，它允许用户在 R 环境中享受PyTor

【Pytorch】优化器（Optimizer）模块‘torch.optim’

m0_62977737的博客

11-29

1811

提供了多种优化器（如 SGD、Adam、RMSprop 等）用于训练神经网络，用户可以选择合适的优化器来优化模型的参数。常见的优化器包括Adam（适应性调整学习率）、SGD（随机梯度下降）、RMSpropAdagrad等，选择哪个优化器取决于你的任务、模型和实验。优化器的核心工作流程包括：清零梯度、计算梯度、反向传播、更新参数。选择合适的优化器和调优超参数（如学习率）是深度学习训练的一个关键部分。

python torch.optim模块

qq_35568823的博客

09-02

1864

本篇笔记主要介绍torch.optim模块，主要包含模型训练的优化器Optimizer。

深入浅出：探索PyTorch中的torch.optim

DeepViewInsight的博客

09-13

386

首先，让我们搞清楚是什么。在深度学习中，我们通常会使用优化算法来调整神经网络的权重和偏差，以便模型能够更好地拟合训练数据。是PyTorch中的一个模块，它提供了各种优化算法的实现，用于自动化地优化神经网络的参数。换句话说，可以帮助我们让模型更好地学习，从而提高性能。首先，我们需要定义一个神经网络模型。这个模型通常由层（layers）组成，每个层包含一些神经元和权重。这些权重是需要被优化的参数。return x在上面的例子中，我们定义了一个简单的神经网络模型MyModel。

torch.optim

芒果干的博客

10-12

719

本文目录一、torch.optim.SGD二、torch.optim.Adagrad三、torch.optim.RMSprop四、torch.optim.Adam 在optimizer优化器一节中讲解了四个优化器，分别是GD, SGD, SGDM, Adagrad, RMSProp, Adam，在PyTorch的torch.optim中包含了后五个，这里讲解这五个优化器的PyTorch使用方法一、torch.optim.SGD torch.optim.SGD包含了SGD以及SGDM torch.optim

图机器学习（7）——图神经网络 (Graph Neural Network, GNN)

最新发布

盼小辉丶的博客

07-15

7990

图神经网络 (Graph Neural Network, GNN) 是一类专门处理图结构数据的深度学习方法。这类方法也被称为几何深度学习 (geometric deep learning)，在社交网络分析、计算机图形学等众多领域正受到日益广泛的关注。在本节中，我们介绍了 GNN 的核心原理，将卷积等经典深度学习范式拓展至非欧几里得图空间，实现了局部结构与全局特征的层次化提取。

图神经网络实战（20）——时空图神经网络

盼小辉丶的博客

11-11

7308

本节介绍了具有时空信息的图数据。这种时空成分在许多应用中都很有帮助，主要与时间序列预测有关。我们介绍了两种符合这种定义的图：静态图(特征随时间变化)和动态图(特征和拓扑结构会发生变化)。PyTorch Geometric Temporal 是 PyTorch Geometric 的扩展，专门用于处理时空图神经网络。此外，我们实现了 EvolveGCN 架构，该架构使用 GRU 或 LSTM 网络更新 GCN 参数。应用此架构执行 Web 流量预测，并且在有限的数据集上取得了出色的结果。

PyTorch之torch.optim

qiu_huohuo

04-26

360

在PyTorch的torch.optim包中提供了非常多的可实现参数自动优化的优化器，比如SGD、AdaGrad、RMSProp、Adam等，这些类都可以被直接调用，使用起来也非常方便。具体的调用为：一：torch.optim.对应优化器 optimizer = torch.optim.Adam(models.parameters(),lr = learning_rate) mo...

Pytorch：torch.optim模块

weixin_42046845的博客

11-29

1293

本篇笔记主要介绍torch.optim模块，记录学习过程在深度学习中，我们通常会使用优化算法来调整神经网络的权重和偏差，以便模型能够更好地拟合训练数据。torch.optim是PyTorch中的一个模块，它提供了各种优化算法的实现，用于自动化地优化神经网络的参数。换句话说，torch.optim可以帮助我们让模型更好地学习，从而提高性能。

13、TORCH.OPTIM

u013049912的博客

07-21

4629

torch.optim 是一个实现各种优化算法的包。大部分常用的方法都已经支持，接口也足够通用，以后也可以轻松集成更复杂的方法。 How to use an optimizer 要使用 torch.optim，您必须构造一个优化器对象，该对象将保存当前状态并根据计算出的梯度更新参数。构建它要构造一个优化器，你必须给它一个包含要优化的参数（都应该是 Variable s）的迭代。然后，您可以指定特定于优化器的选项，例如学习率、权重衰减等。 NOTE 如果您需要通过 .cuda() 将模型移

torch.optim优化器

qq_35608277的博客

01-03

796

基本使用方法 import optim ptimizer=optim.SGD(params=net.parameters(),lr=0.1) optimizer.zero_grad() //梯度清零 output=net(input) output.backward(output) optimizer.step() import torch.optim as optim #定义了网络 n...

【PyTorch】torch.optim.SGD 类：随机梯度下降（SGD）优化器

彬彬侠的博客

01-17

2274

torch.optim.SGD 是 PyTorch 中实现的随机梯度下降（SGD）优化器，用于更新模型参数。它是最基础也是最常见的优化算法之一。SGD 在训练神经网络时通过最小化损失函数来调整网络权重。SGD 是一个基于批量的优化方法，每次更新只基于一个样本（或者一个小批量）。相比于批量梯度下降（使用所有样本计算梯度），SGD 每次只计算一个样本的梯度，因而可以节省计算资源，尤其是在数据集较大的时候。

pytorch学习（7）——神经网络优化器torch.optim

qq_45362336的博客

08-26

828

pytorch优化器学习笔记，设置优化器算法，进行梯度下降算法迭代，优化网络中的weight和bias值。

【PyTorch】torch.optim介绍

王多鱼的梦想

02-16

1468

`torch.optim` 是 PyTorch 中用于优化神经网络模型参数的模块，它实现了多种常见的优化算法（如 SGD、Adam、RMSprop 等），通过计算损失函数对参数的梯度并根据梯度更新模型的权重。

torch.optim详解

m0_49133355的博客

07-17

665

torch.optim 是 PyTorch 中的优化器模块，它提供了一系列用于训练神经网络的优化算法。在这个示例中，我们定义了一个简单的神经网络，使用 Adam 优化器来优化模型参数，并在每个训练周期中执行前向传播、计算损失、反向传播和参数更新。betas: 用于计算梯度和梯度平方的运行平均值的系数（默认值为 (0.9, 0.999)）。weight_decay: 权重衰减（L2惩罚）。weight_decay: 权重衰减（L2惩罚）。weight_decay: 权重衰减（L2惩罚）。

还是torch中的optim模块

qq_36302589的博客

05-27

580

最近在看BoF中的一些trick，发现在代码实现中有考虑对于参数的weight_decay只对卷积层的权重来进行正则化约束，不对所有参数进行约束，话不多说上代码，以torchvision中定义的resnet18为例 import torchvision import torch.optim as optim model1 = torchvision.models.resnet18() parmas = [] params_dict = dict(model1.named_parameters()) fo