抛砖引玉：链式法则与多米诺效应

原创已于 2025-09-17 08:39:47 修改 · 977 阅读

·

25

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #神经网络 #算法 #python

于 2025-09-17 08:24:38 首次发布

新奇特专栏收录该内容

45 篇文章

订阅专栏

学习反向传播时总是不理解，感觉困惑和难记，飘在天上的知识还是书本📖上的，不是自己的。于是，从知识中提炼特征，去生活中找对应特征的现象。

那么生活中有这样类似的，能解释通的吗？

当然！于是有了本文，我找到的

链式法则的求导计算与生活中一个非常贴切的例子是：多米诺效应。

让我们来一步步拆解这个类比，你会发现它们惊人地相似。

核心概念对应

· 复合函数 y = f(g(x)) = 一长串排列好的多米诺骨牌

· 内层函数 u = g(x) = 从你推倒第一张牌（输入x）到中间某一张牌（我们称之为牌u）的状态

· 外层函数 y = f(u) = 从中间那张牌（u）到最后一张牌倒下（最终输出y）的过程

· 导数 dy/du 或 du/dx = 一张骨牌倒向下一张骨牌的“速度”或“效率”

---

场景演绎：小明推倒多米诺骨牌

假设小明用手指轻轻推倒第一块骨牌（输入 x），最终导致最后一块骨牌砸响一个铃铛（输出 y）。整个过程就是一个复合函数 y = f(g(x))。

现在，我们想问一个问题：“小明手指推初始牌的速度稍微快一点，最终铃铛被砸响的速度会变化多少？” 这就是在求 dy/dx。

链式法则的计算过程：

根据链式法则，dy/dx = dy/du * du/dx

1. 计算 du/dx（内层导数）：

· 这衡量的是 “第一张牌倒下的速度” 对 “中间那张牌u倒下的速度” 的影响。

· 这取决于第一张牌和第二章牌之间的距离和牌的大小。如果它们离得很近，第一张牌倒得快，第二张也很快会倒（du/dx 值很大）。如果离得远，影响就小（du/dx 值很小）。

2. 计算 dy/du（外层导数）：

· 这衡量的是 “中间那张牌u倒下的速度” 对 “最后一张牌砸响铃铛的速度” 的影响。

· 这取决于中间牌u和最后一张牌之间的距离和牌的大小。同理，距离近则影响大（dy/du 值大），距离远则影响小（dy/du 值小）。

3. 最终效应 dy/dx：

· 最终，小明手指速度对最终结果的总影响，等于 “第一张牌对中间牌的影响效率” 乘以 “中间牌对最终结果的影响效率”。

· dy/dx = (u牌影响y牌的效率) * (x牌影响u牌的效率)

这就好比信号的传递：小明的“推力信号”需要经过多个环节的放大或衰减，最终才能到达终点。链式法则就是计算这个“总传递系数”的方法。

---

这个类比如何解释链式法则的精髓？

1. 分解问题：你不需要一口气考虑从头到尾的所有骨牌。链式法则让你可以把漫长的连锁反应分解成一个个简单的、相邻的步骤，只关心相邻骨牌之间的关系，最后再把所有环节的“影响效率”乘起来。这大大简化了复杂问题的求解。

2. 乘法关系：整个链条的总体灵敏度（总导数）是各个环节灵敏度的乘积。如果中间任何一个环节的“效率”很低（比如有两张牌离得非常远，du/dx 几乎为0），那么无论小明推得多快，最终都无法快速响铃（dy/dx 也会接近0）。这解释了为什么在深层神经网络中，梯度（导数）可能会消失（Vanishing Gradient）——因为中间某些层的“传递效率”太低了。

3. 通用性：无论多米诺骨牌有多长（函数有多复合），比如 y = f(g(h(i(x))))，这个法则都适用。你只需要像拆多米诺一样，一环一环地求导，再把所有导数乘起来： dy/dx = dy/df * df/dg * dg/dh * dh/di * di/dx

所以，下次当你使用链式法则时，就可以想象自己是在计算一排多米诺骨牌中，初始力量是如何通过一连串的连锁反应，最终影响到最终结果的。这就是微积分之美在现实世界中的生动体现！

PS：长辈常说的“一岁看小三岁看老”，也有类似的道理。

这熊孩子，小时候就这么聪明，长大了更不得了啊

这小姑娘，活活的一个美人胚，长大了不得倾国倾城啊

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。