人工智能——自动微分

原创

于 2025-08-07 20:20:12 发布 · 1.1k 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

一、自动微分的基础概念—计算图

要理解自动微分，必须先理解计算图：它是用 “节点” 和 “边” 直观表示计算过程的图形。

节点：分为两种 ——
- 变量节点（如输入 x、参数 w、中间结果 a、输出 y）；
- 操作节点（如加法 \(+\)、乘法 \(\times\)、激活函数 \(\sigma\) 等）。
边：表示变量与操作之间的依赖关系（“谁是谁的输入”）

各个节点按照反向传播后，其梯度是否会被自动释放又可以分为：叶子节点和非叶子节点

1. 叶子节点（Leaf Nodes）

定义：用户直接创建的输入变量（如训练数据 x、模型参数 \(w, b\)），没有 “父节点”（不是任何操作的输出）。
特点：在反向传播中，它们的梯度会被保留（存储在 .grad 属性中），因为模型训练需要用这些梯度更新参数

2. 非叶子节点（Non-leaf Nodes）

定义：由操作生成的中间结果（如 a = w * x、输出 y = a + b），有明确的 “父节点”（依赖其他变量）。
特点：反向传播后，它们的梯度会被自动释放（默认不保留），以节省内存（中间结果的梯度对参数更新没用）

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

a150463

关注关注

30
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

自动微分(Automatic Differentiation)

allein_STR的博客

06-30

2452

目录什么是自动微分手动求解法数值微分法符号微分法自动微分法自动微分Forward Mode 自动微分Reverse Mode 参考引用现代深度学习系统中（比如MXNet， TensorFlow等）都用到了一种技术——自动微分。在此之前，机器学习社区中很少发挥这个利器，一般都是用Backpropagation进行梯度求解，然后进行SGD等进行优化更新。手动实现过backprop算法的同学应该可以体会到其中的复杂性和易错性，一个好的框架应该可以很好地将这部分难点隐藏于用户视角，而

自动微分（Auto differentiation）机制详解

weixin_60737527的博客

10-19

6715

自动微分法的原理与算法实现

参与评论您还未登录，请先登录后发表或查看评论

【动手学深度学习】2.5. 自动微分

05-30

2387

来使用，而不是用来计算梯度的变量。这时，就可以用“分离计算图”的方法，把计算图中的一部分“切断”，让它不参与反向传播。换言之，对于任何a，存在某个常量标量k，使得f(a)=k*a，其中k的值取决于输入a；神经网络中，计算图 = 节点（神经元/参数/数学运算等）+ 边（数据流动方向）。这里，我们的目的不是计算微分矩阵，而是单独计算批量中每个样本的偏导数之和。它从输出端（损失函数）开始，向输入端（模型参数）反向计算梯度。有时，我们希望将某些计算移动到记录的计算图之外。，自动计算出目标函数关于模型参数的导数。

使用 Matlab 对象自动微分：自动计算函数的导数，而不使用有限差分近似。-matlab开发

05-30

自动微分是一种使用链式规则计算函数导数的技术。 Matlab 对象可以轻松实现自动微分。请注意，此程序包是在Matlab的较旧版本中实现的。您可能需要针对较新版本对其进行编辑。使用自动微分计算点 [1,2] 处 Rosenbrock 函数的值和导数的示例如下： x=adiff([1,2]); % 在 [1,2] 处创建自动微分对象罗森 = 100*(x(1)^2-x(2))^2+(x(1)-1)^2; % 计算 Rosenbrock 函数。 [x,dx] = adiffget(x); ％检索值x和导数dx 然后 x = 100 和 dx = [-400,200]。 adiff 对象包括一个辅助函数，可以将任何没有导数的优化转换为有导数的优化。例如，如果您有一个想要优化的函数 f，但它不计算导数，通常调用 fminunc('autodiff',x0,options,'f',

再识自动微分机制-PyTorch

05-25

这是博主主页的系列文章：＜5＞【深度学习 × PyTorch】“自动微分”机制 | 通俗理解 pytorch中的autograd、backward | 实例详解tensors、grad_tensors，将于近期发布。建议结合专栏【Python从入门到人工智能】学习，效果会更好！

【动手学深度学习笔记】一、关于自动微分和backward()函数的原理

m0_51436960的博客

11-19

384

来看看深度学习中的自动微分和反向传播的秘密吧~

谈谈自动微分（Automatic Differentiation）

Paper weekly

01-03

783

©作者 | JermyLu学校 | 中国科学院大学研究方向 | 自然语言处理与芯片验证引言众所周知，Tensorflow、Pytorch 这样的深度学习框架能够火起来，与其包含自动微分机制...

自动微分autograd

01-22

自动微分法是一种介于符号微分和数值微分的方法。数值微分强调一开始直接代入数值近似求解；符号微分强调直接对代数进行求解，最后才代入问题数值；自动微分将符号微分法应用于最基本的算子，比如常数，幂函数，指数函数，对数函数，三角函数等，然后代入数值，保留中间结果，最后再应用于整个函数。自动微分应用相当灵活，可以做到完全向用户隐藏微分求解过程，由于它只对基本函数或常数运用符号微分法则，所以它可以灵活结合编程语言的循环结构，条件结构等，使用自动微分和不使用自动微分对代码总体改动非常小，并且由于它的计算实际是一种图计算，可以对其做很多优化。

Pytorch框架——自动微分和反向传播

最新发布

Xyz_Overlord的博客

06-13

493

自动微分（Automatic Differentiation，AD）是一种利用计算机程序自动计算函数导数的技术，它是机器学习和优化算法中的核心工具（如神经网络的梯度下降）。计算梯度的目的是更新权重w和b，，其中value是梯度值，学习率需要提前指定，求导计算梯度，前面我们学过了手动求导，这次使用自动微分的方法，来简化我们的工作量。注意：1. w和b一定是可自动微分的张量，类型是浮点型，超参数requries_grad=Ture表示允许自动微分。

从0开始深度学习（2）——自动微分

立志成为炼丹师？

09-01

1262

对于一个多变量函数fx1x2xnfx1x2xn其中点aa1a2anaa1a2an处的梯度是一个向量，通常表示为∇fagrad⁡fa∇fagradfa∇fa∂f∂x1a∂f∂x2a∂f∂xna∇fa∂x1∂fa∂x2∂fa∂xn∂fa。

深度学习——自动微分

EWQOR的博客

03-16

1819

深度学习框架通过自动计算导数，即自动微分来加快求导

【深度学习】—— 自动微分、非标量变量的反向传播、分离计算、 Python控制流的梯度计算

我们都是被分成两半的人，一边热爱生活，一边憎恨生活。面对生活，我们总是在矛盾的两端摇摆，在反复的矛盾和犹豫中，一边踉跄前行，一边重振旗鼓。我渴望改变，渴望变得更好，渴望找到出口……就像一个溺水人的挣扎，就像一个救生圈。我是一个矛盾集合体，想要变得快乐，但是

09-28

1630

然而，虽然这些更奇特的对象确实出现在高级机器学习中（包括深度学习中），但当我们调用向量的反向计算时，我们通常会试图计算一批训练样本中每个组成部分的损失函数的导数。重要的是，我们不会在每次对一个参数求导时都分配新的内存。使用自动微分的一个好处是：即使构建函数的计算图需要通过 Python 控制流（例如，条件、循环或任意函数调用），我们仍然可以计算得到的变量的梯度。然后我们记录⽬标值的计算，执⾏它的反向传播函数，并访问得到的梯度。在我们的例子中，我们只想求偏导数的和，所以传递一个 1 的梯度是合适的。

自动微分

码农ZZK的博客

01-05

1558

绍计算机程序的求导机制分为四种人工计算出导数，并写成代码形式数值计算微分，即取极限求导数符号微分，使用表达式来计算导数自动微分比如下面的程序所示 import numpy as np def sigmoid(x): """ Compute sigmoid Function """ return 1 / (1+np.exp(-x)) def sigmoid_grad(x): return np.exp(-x) / np.square(1 + np

自动微分(Automatic Differentiation)简介

热门推荐

CarlXie

04-18

5万+

现代深度学习系统中（比如MXNet， TensorFlow等）都用到了一种技术——自动微分。在此之前，机器学习社区中很少发挥这个利器，一般都是用Backpropagation进行梯度求解，然后进行SGD等进行优化更新。手动实现过backprop算法的同学应该可以体会到其中的复杂性和易错性，一个好的框架应该可以很好地将这部分难点隐藏于用户视角，而自动微分技术恰好可以优雅解决这个问题。接下来我们将一起...

《20天吃透Pytorch》Pytorch自动微分机制学习

瞳瞳瞳呀

06-30

759

自动微分机制 Pytorch一般通过反向传播 backward 方法实现这种求梯度计算。该方法求得的梯度将存在对应自变量张量的grad属性下。除此之外，也能够调用torch.autograd.grad 函数来实现求梯度计算。这就是Pytorch的自动微分机制。一，利用backward方法求导数 backward 方法通常在一个标量张量上调用，该方法求得的梯度将存在对应自变量张量的grad属性下。如果调用的张量非标量，则要传入一个和它同形状的gradient参数张量。相当于用该gradient参

自动微分(Auto differentiation)

qq_41764621的博客

01-03

5872

1.自动微分是干什么的：自动微分现在已经是深度学习框架的标配，我们写的任何模型都需要靠自动微分机制分配模型损失信息，从而更新模型。简言之，就是在模型更新计算梯度的时候会用到自动微分。在数学和计算机代数中，自动微分有时称作演算式微分，是一种可以借由计算机程序计算一个函数导数方法。两种传统做微分的方法为：对一个函数的表示式做符号上的微分，并且计算其在某一点上的值。使用差分。（即数值微分）使用符号微分最主要的缺点是速度慢及将计算机程序转换成表示式的困难，且很多函数在要计算更高阶微分时会变得复杂。

揭秘AI框架核心：自动微分原理与MindSpore实践

在【自动微分】系列的第一篇中，我们将深入探讨AI框架中的核心功能——自动微分。自动微分是人工智能和机器学习中不可或缺的技术，它使得复杂模型的训练和优化过程变得更加高效和精确。本课程旨在帮助学员理解自动...