自动求导

最新推荐文章于 2024-10-21 13:02:43 发布

z0n1l2

最新推荐文章于 2024-10-21 13:02:43 发布

阅读量868

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：自动求导 dual number

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z0n1l2/article/details/81045807

深度学习专栏收录该内容

49 篇文章

订阅专栏

自动求导是现代深度学习框架的核心功能，它使得用户可以专注于模型设计而非手动计算梯度。本文探讨了自动求导的三种方法：数值微分、符号微分和双数法。数值微分基于导数的定义进行计算；符号微分通过预先编码常见函数的导数实现；双数法则是一种高级技术，利用双数的运算规则求导，虽然复杂但精确。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

自动求导

当前深度学习框架给深度学习的研究和应用带了诸多方便，其中之一就是让使用者不必关心求导计算，而是专注于于自己的工作。那么面对复杂的网络结构，框架是如何完成求导的？

Numeratical differentiation

源
回到导数最基础的定义

d f ( x ) d x = f ( x + h ) - f ( x ) h

$\frac{df(x)}{dx} = \frac{f(x+h)-f(x) }{h}$
h选的足够小，就可以逼近

f(x) f ( x ) $f(x)$ 的导数，但这种方式的缺陷是

h h $h$ 不易选择：太大则结果误差增大，太小就要面对计算机浮点误差。不过这种方法因为简单明了，可以用来做校验，给出一组实验数据，用这种方法计算出梯度，和其他方法得到的梯度做比较，差异小于给定的阈值，则认为两种计算梯度的方法一致。

Symbolic differentiation

源
常见函数的导数都有形式解（比如三角函数，指数函数，对数函数等），把形式解都硬编码到程序中，站在用户的角度自然可以实现自动求导。目前这应该是使用最广的自动求导方法，很多框架在自定义的运算中，只需要用户提供forward/backward两个接口即可，就是同样的道理。

dual numbers

源
dual number是虚数的推广，通过定义一组其上的运算规则，就可以用来计算给定函数的导数。这个感觉很有技术含量，没有详细研究，给出一个多项式求导的例子
这里写图片描述
其中b可以任意值，自然为了自动求导，此处可以选择 $b=1$ $\epsilon$ 就是dual number，必须满足 $\epsilon ^2 = 0$
PS: 不知道哪个框架用了这种方法自动求导

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。