链式法则是微积分中用于求复合函数导数的核心法则,本质是解决“函数套函数”的求导问题,其核心逻辑是“从外到内、逐层求导再相乘”。
1. 核心定义(单变量情况)
若函数 ( y = f(u) ),且 ( u = g(x) )(即 ( y ) 是 ( x ) 的“复合函数”,( y = f[g(x)] )),则 ( y ) 对 ( x ) 的导数为:
dydx=dydu⋅dudx\frac{dy}{dx} = \frac{dy}{du} \cdot \frac{du}{dx}dxdy=dudy⋅dxdu
- 含义:先求外层函数 ( f(u) ) 对中间变量 ( u ) 的导数(dydu)( \frac{dy}{du} )(dudy),再求内层函数 ( g(x) ) 对自变量 ( x ) 的导数(dudx)( \frac{du}{dx} )(dxdu),最后将两个导数相乘。
2. 直观理解:“连锁反应”
可类比“速度的传递”——比如:
- 若 ( y ) 随 ( u ) 的变化率是 ( dydu=2\frac{dy}{du} = 2dudy=2 )(( u ) 变1,( y ) 变2);
- ( u ) 随 ( x ) 的变化率是 ( dudx=3\frac{du}{dx} = 3dxdu=3 )(( x ) 变1,( u ) 变3);
- 则 ( y ) 随 ( x ) 的变化率就是 ( 2×3=62 \times 3 = 62×3=6 )(( x ) 变1,( y ) 最终变6),这就是“链式”的含义。
3. 多变量扩展(偏导数)
若 ( z = f(u, v) ),且 ( u = g(x, y) )、( v = h(x, y) )(多变量复合),则 ( z ) 对 ( x ) 的偏导数为:
[
∂z∂x=∂z∂u⋅∂u∂x+∂z∂v⋅∂v∂x\frac{\partial z}{\partial x} = \frac{\partial z}{\partial u} \cdot \frac{\partial u}{\partial x} + \frac{\partial z}{\partial v} \cdot \frac{\partial v}{\partial x}∂x∂z=∂u∂z⋅∂x∂u+∂v∂z⋅∂x∂v
]
- 逻辑:每个中间变量(( u, v ))都对 ( x ) 有贡献,需分别求“外层对中间”“中间对自变量”的偏导数,再相加(类似“多路径叠加”)。
4. 简单示例
比如求 ( y=sin(x2)y = \sin(x^2)y=sin(x2) ) 的导数:
- 外层函数:( y=sin(u)y = \sin(u)y=sin(u) ),中间变量 ( u=x2u = x^2u=x2 );
- 外层对中间的导数:( dydu=cos(u)\frac{dy}{du} = \cos(u)dudy=cos(u) );
- 中间对自变量的导数:( dudx=2x\frac{du}{dx} = 2xdxdu=2x );
- 相乘得:( dydx=cos(u)⋅2x=2xcos(x2)\frac{dy}{dx} = \cos(u) \cdot 2x = 2x\cos(x^2)dxdy=cos(u)⋅2x=2xcos(x2) )。
链式法则是求导的“基础工具”,从简单的单变量复合函数,到深度学习中神经网络的反向传播(如对多层权重的梯度计算),本质都依赖链式法则的逐层传递逻辑。
1816

被折叠的 条评论
为什么被折叠?



