深度学习3 自动微分（梯度计算、控制、清零、叶子节点）

大模型研究的后腿

已于 2024-12-02 18:59:16 修改

阅读量529

点赞数 5

文章标签：深度学习人工智能

于 2024-11-22 20:23:40 首次发布

本文链接：https://blog.youkuaiyun.com/h0039490/article/details/143981315

版权

五、自动微分

1、基础概念

模块 autograd 负责自动计算张量操作的梯度，具有自动求导功能；autograd 创建一个动态计算图来跟踪张量的操作，每个张量是计算图中的一个节点，节点之间的操作构成图的边。

属性 requires_grad 决定是否对张量进行梯度计算，默认不进行。

方法 backward 进行反向传播，计算张量梯度。

tensor.grad 返回梯度值

2、计算梯度

元素必须为浮点数类型

2.1、标量

# 张量的梯度计算
import torch
x = torch.tensor(1.0,requires_grad = True)
y = x**2 +2*x +3
y.backward() # 梯度计算，(1,求y的导数；2、将标量带入导数函数求值)
# x.grad 表示求导带入值结果
print(x.grad)

import torch
# 多标量的梯度计算
x1 = torch.tensor(1., requires_grad=True)
x2 = torch.tensor(2., requires_grad=True)
y = x1**2 + 3*x2 +5
y.backward()
print(x1.grad)
print(x2.grad)

2.2、向量

损失函数接收向量后，需要进行整合称为一个元素（一半使用sum）才能进行反向传播。

反向传播后自动拆分为不同元素值的结果。

# 向量的梯度计算
import torch
x = torch.tensor([1.0,2.0,3.0],requires_grad = True)
y = x**2 +2*x +5
print(y)
y = y.sum()
print(y)
y.backward()
print(x.grad)

import torch
# 多向量的梯度计算
x1 = torch.tensor([1.,2.], requires_grad=True)
x2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大模型研究的后腿

关注关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

动手深度学习笔记（五）2.5 自动微分

juluwangriyue的博客

02-06

475

动手深度学习笔记（五）2.5 自动微分2. 预备知识2.5. 自动微分2.5.1. 一个简单的例子2.5.2. 非标量变量的反向传播2.5.3. 分离计算2.5.4. Python控制流的梯度计算2.5.5. 小结2.5.6. 练习 2. 预备知识 2.5. 自动微分正如我们在 2.4节中所说的那样，求导是几乎所有深度学习优化算法的关键步骤。虽然求导的计算很简单，只需要一些基本的微积分。但对于复杂的模型，手工进行更新是一件很痛苦的事情（而且经常容易出错）。 深度学习框架通过自动计算导数，即自动微分（a

【Python深度学习】零基础掌握Pytorch自动微分autogradqs

Mr数据杨

11-29

977

通过了解了自动微分的基本原理，还深入探索了它在深度学习中的实际应用。从张量的基本操作到复杂的计算图，从计算简单的梯度到可视化整个神经网络，一步步揭开了自动微分的神秘面纱。无论是简单的张量操作还是复杂的神经网络训练，自动微分都在背后默默地发挥着作用。它让原本需要复杂数学推导的任务变得简单，能够专注于构建和优化的模型，而不是纠结于每一个数学公式。在深度学习的道路上就像是导航系统，指引正确地调整每一个参数，确保模型能够顺利学习和成长。

参与评论您还未登录，请先登录后发表或查看评论

深度学习-PyTorch-自动微分机制练习（完整代码）

05-23

这是 深度学习_PyTorch_自动微分机制练习（完整代码），已经在博客中记录，建议结合专栏【Python从入门到人工智能】学习，效果会更好！

华为深度学习框架MindSpore正式开源：自动微分不止计算图.md

04-02

今年的华为开发者大会 HDC 2020 上，除了**昇腾、鲲鹏等自研芯片硬件平台**之外，最令人期待的就是**深度学习框架 MindSpore 的开源**了。今天上午，华为 MindSpore **首席科学家陈雷**在活动中宣布这款产品正式开源，我们终于可以在开放平台上一睹它的真面目。本文是根据机器之心报道的MindSpore 的开源介绍而整理的.md笔记作为一款支持**端、边、云独立/协同的统一训练和推理框架，华为希望通过这款完整的软件堆栈，实现**一次性算子开发、一致的开发和调试体验**，以此帮助开发者实现**一次开发，应用在所有设备上平滑迁移**的能力。三大创新能力：新编程范式，执行模式和协作方式由**自动微分、自动并行、数据处理**等功能构成开发算法即代码、运行高效、部署态灵活**的**特点**，三层核心：从下往上分别是**后端运行时、计算图引擎及前端表示层**。最大特点：采用了业界最新的 **Source-to-Source 自动微分**，它能**利用编译器及编程语言的底层技术**，进一步**优化以支持更好的微分表达**。主流深度学习框架中主要有**三种自动微分技术，才用的不是静态计算图、动态计算图，而是基于**源码**转换：该技术源以**函数式编程框架**为基础，以**即时编译（JIT）**的方式**在中间表达（编译过程中程序的表达形式）上做自动微分变换**，支持**复杂控制流场景、高阶函数和闭包**。 MindSpore 主要概念就是张量、算子、单元和模型其代码有两个比较突出的亮点：计算图的调整，动态图与静态图可以一行代码切换；自动并行特性，我们写的串行代码，只需要多加一行就能完成自动并行。

【深度学习领域】PyTorch张量操作与自动微分技术详解：从基础概念到实战应用

最新发布

04-15

内容概要：本文深入探讨了PyTorch中的张量操作与自动微分技术。首先介绍了PyTorch的核心优势及其在学术研究和工业应用中的广泛用途，重点讲解了张量作为PyTorch的核心数据结构，涵盖张量的创建、形状操作、索引与切片、数学运算及广播机制。随后详细解释了自动微分的原理和实现方式，包括动态计算图、链式法则的应用，以及autograd模块的具体使用方法。最后通过简单线性回归和多层感知机两个案例，全面展示了张量操作和自动微分技术在模型训练中的实际应用。; 适合人群：对深度学习感兴趣的初学者及有一定编程基础的研发人员，特别是希望深入了解PyTorch框架内部机制的人群。; 使用场景及目标：①掌握张量的各种操作方法，包括创建、形状变换、索引、切片和数学运算；②理解自动微分的工作原理及其在深度学习中的重要性；③学会使用autograd模块进行梯度计算，掌握梯度累加、detach()方法和no_grad()上下文管理器的使用；④通过案例实战，熟悉从数据准备、模型构建、训练到评估的完整流程。; 阅读建议：本文内容详实，理论与实践相结合，建议读者在学习过程中跟随代码示例动手实践，加深对张量操作和自动微分技术的理解。同时，结合案例实战部分，逐步构建和训练自己的模型，巩固所学知识。

动手学深度学习笔记4——微积分&自动微分

weixin_66472769的博客

04-11

1086

《动手学深度学习》笔记第二章预备知识 2.4微积分&2.5自动微分

深度学习——自动微分

EWQOR的博客

03-16

1688

深度学习框架通过自动计算导数，即自动微分来加快求导

深度学习-自动微分

baopapa的博客

10-22

919

求导是几乎所有深度学习优化算法的关键步骤。虽然求导的计算很简单，只需要一些基本的微积分。但对于复杂的模型，手工进行更新是一件很痛苦的事情（而且经常容易出错）。深度学习框架通过自动计算导数，即自动微分（automatic differentiation）来加快求导。实际中，根据我们设计的模型，系统会构建一个计算图（computational graph），来跟踪计算是哪些数据通过哪些操作组合起来产生输出。自动微分使系统能够随后反向传播梯度。

深度学习利器之自动微分(1)

罗西的思考

10-12

743

本文和下文以 Automatic Differentiation in Machine Learning: a Survey 这篇论文为基础，逐步分析自动微分这个机器学习的基础利器。

深度学习day3-自动微分

keep_keeprogress的博客

11-22

564

torch.autograd模块：自动微分模块，自动计算张量操作的梯度，可以自动求导实现权重参数的更新。

Pytorch实现将模型的所有参数的梯度清0

12-17

有两种方式直接把模型的参数梯度设成0： model.zero_grad() optimizer.zero_grad()#当optimizer=optim.Optimizer(model.parameters())时，两者等效如果想要把某一Variable的梯度置为0，只需用以下语句： Variable.grad.data.zero_() 补充知识：PyTorch中在反向传播前为什么要手动将梯度清零？optimizer.zero_grad()的意义 optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0. 在学习pytorch的时候注

fzerotx.zip_fzero_fzerotx_fzerotx是什么_matlab_数值算法

07-15

数值分析fzero算法，数值分析小作业

pytorch自动微分原理

2303_77224751的博客

09-21

723

Tensor是PyTorch实现多维数组计算和自动微分的关键数据结构。一方面，它类似于numpy的ndarray，用户可以对Tensor进行各种数学运算；另一方面，当设置之后，在其上进行的各种操作就会被记录下来，用于后续的梯度计算，其内部实现机制被称为。Variable变量：在PyTorch早期版本中，Tensor只负责多维数组的运算，自动微分的职责是Variable完成的，因此经常可以看到因而产生的包装代码。而在0.4.0版本之后，二者的功能进行了合并，使得自动微分的使用更加简单了。

【AI系统】计算图与自动微分

ZOMI酱

12-09

950

自动求导应用链式法则求某节点对其他节点的雅可比矩阵，它从结果节点开始，沿着计算路径向前追溯，逐节点计算雅可比。将神经网络和损失函数连接成一个计算图，则它的输入、输出和参数都是节点，可利用自动求导求损失值对网络参数的雅可比，从而得到梯度。在前面的内容我们深入地探讨过自动微分的原理，可是 AI 框架中神经网络模型怎么跟自动产生连接关系呢？自动微分跟反向传播是什么关系呢？在实际 AI 框架的实现中，自动微分的实现方式有什么变化吗？

自动微分-深度学习系统-一个好博客

baidu_40840693的博客

10-25

551

https://oldpan.me/ 以下是本系列文章的笔记来源： CSE 599W: Systems for ML AI-Sys Spring 2019 http://dlsys.cs.washington.edu/schedulehttps://ucbrise.github.io/cs294-ai-sys-sp19/https://blog.youkuaiyun.com/tealex/article...

深度学习中的数据操作（五）自动微分基于pytorch实现

m0_50292871的博客

03-02

1249

1.5 自动微分 """ 1.5.1 一个简单的例子求导是深度学习优化算法的关键步骤，因此自动微分可以大大简化深度学习的计算步骤从很小的例子来看，y=2x^⊤x，若想对y求导，就可以借助pythorch的相关函数 """ import torch x = torch.arange(5.0) print(x) """接下来要计算y关于x的梯度，自然需要有地方来存储这些计算出来的梯度""" x.requires_grad_(True) #这也可以在定义x的时候完成：torch.arange(4.

深度学习从入门到精通+TensorFlow案例演示：自动微分

Lee达森的博客

01-28

871

反向传导时，会更新每一层的权重，这时就会用到偏微分运。单，只要熟悉了运作的架构，后续复杂的模型就可以运用自。）定义训练函数：在自动微分中需重新计算损失函数值，）显示结果：回归线确实居于样本点中线。）产生随机数作为数据集，进行测试。函数两次，即能取得二阶导数。同样地，我们直接以实践代替长篇大论，请参阅。自动微分的功能，正向与反向传导变得非常简。）时，该变量会自动参与自动微。）时，如欲参与自动微分，则需。会被自动回收，用完之后，可使用。）多变量计算导数：各自使用。得每一个变量的梯度。

从零开始学习深度学习库-4：自动微分

第欧根尼的酒桶的博客

03-18

1328

自动微分（Automatic Differentiation，简称AD）是一种计算数学函数导数（梯度）的技术。在深度学习和其他领域中，自动微分是一种极其重要的工具，特别是在梯度下降这类优化算法中。不同于数值微分和符号微分，自动微分以一种高效和精确的方式计算导数。自动微分的关键特点包括：1.计算图: 自动微分通常通过构建一个计算图来实现，这个图包含了原始函数的所有操作。在这个图中，每个节点代表一个操作（如加法、乘法等），而边代表数据（如变量、常数）之间的依赖关系。

自动微分(Automatic Differentiation)简介

YZXnuaa的博客

03-16

823

现代深度学习系统中（比如MXNet， TensorFlow等）都用到了一种技术——自动微分。在此之前，机器学习社区中很少发挥这个利器，一般都是用Backpropagation进行梯度求解，然后进行SGD等进行优化更新。手动实现过backprop算法的同学应该可以体会到其中的复杂性和易错性，一个好的框架应该可以很好地将这部分难点隐藏于用户视角，而自动微分技术恰好可以优雅解决这个问题。接下来我们将一起...