微积分基础 | 核心概念 / 公式推导

最新推荐文章于 2025-09-07 12:14:42 发布

原创最新推荐文章于 2025-09-07 12:14:42 发布 · 1.4k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#微积分基础

mathematics 专栏收录该内容

185 篇文章

订阅专栏

注：本文为 “微积分基础” 整理。
zhihu 引文，略作重排。
如有内容异常，请看原文。

微积分入门基础

爱 XR 的麦子编辑于 2024-03-09 16:28・上海 2025-06-17 20:02 更新

前言

微分的表示方法有多种。例如， $f^{'}$ 是一种常见的表示方式，但它容易让人忽略是对哪个变量进行微分。因此，更推荐使用 $\frac{df}{dx}$ 或 $\frac{d}{dx}\left(f(x)\right)$ 。在本文中， $\frac{d}{dx}$ 可以被看作是一个操作符。此外，还有一种常见的表示是 $\dot{f}$ ，在物理学中通常表示对时间 $t$ 的微分。

本文的重点并非提供一套严谨的数学推导。主流的微积分推导基于 $\varepsilon - \delta$ 体系。如果读者对这一套不适应，可以尝试了解无限小量的相关内容。

一次函数

一次函数 (Linear Function)

设函数 $f (x) = y = k x + b$ 。若理解微分是求斜率，则答案显而易见，即 $k$ 。计算 $k$ 的方法如下：

$\frac{y_1 - y_0}{x_1 - x_0}$

对于一次函数而言，该斜率对任意 $x$ 均适用。因此，可以写为：

$\frac{df}{dx} = k$

进一步改写 $k$ ，令 $x_1 - x_0 = h$ ，则有：

$\begin{aligned} \frac{df}{dx}(x_0) &= k \\ &= \frac{f(x_0 + h) - f(x_0)}{x_0 + h - x_0} \\ &= \frac{f(x_0 + h) - f(x_0)}{h} \end{aligned}$

由于一次函数的斜率对任意 $x$ 均适用，且 $h$ 的大小无关紧要，因此可得：

$\frac{df}{dx} = k = \frac{f(x + h) - f(x)}{h}$

二次函数

二次函数 (Quadratic Function)

设函数 $f(x) = y = a x^2$ 。

微分的目的是找到过某一点的切线，以求得该点的斜率。然而，存在两个问题：

过一点可作无数条直线
两点确定一条直线

这两个问题看似无法调和。因此，微分的核心思想是：当 $h$ 不断减小时，两点不断靠近，最终这两点连成的直线的斜率即为该点的斜率，且该斜率应是唯一的。

因此，求微分时，实际上是在求：

$\frac{df}{dx} = \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h}$

接下来，进行推导：

$\frac{df}{dx} = \lim_{h \rightarrow 0} \frac{a(x + h)^2 - a x^2}{h}$

展开完全平方公式后，得：

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{a x^2 + 2 a x h + a h^2 - a x^2}{h} \\ &= \lim_{h \rightarrow 0} \frac{2 a x h + a h^2}{h} \\ &= \lim_{h \rightarrow 0} 2 a x + a h \end{aligned}$

显然，极限仅作用于第二项，因此最终结果为：

$x^2 \quad \Rightarrow \quad \frac{df}{dx} = 2 a x$

多项式函数（幂为正整数）

多项式函数 (Polynomial Function)

设函数 $f(x) = a x^n$ ，其中 $n$ 为任意正整数。

继续使用上述方法：

$\frac{df}{dx} = \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h} = \lim_{h \rightarrow 0} \frac{a(x + h)^n - a x^n}{h}$

接下来需要展开第一项。展开是关键步骤之一。

杨辉三角

杨辉三角的规律是：左上和右上两数之和等于下面的数。杨辉三角的值也是二项式展开的系数。

例如，第三行是完全平方公式的系数。

杨辉三角

二项式展开

当 $n$ 是具体值且较小时，使用杨辉三角较为方便。但对于任意 $n$ 或较大数值时，使用公式更为合适：

$b)^n = \sum_{k=0}^n {}^nC_k\ a^k b^{n-k}$

其中， ${}^nC_k$ 的含义如下：

${}^nC_k = \frac{n!}{(n-k)! k!}$

阶乘、排列、组合

阶乘 (Factorial)，记作 $n!$ ，表示 $n$ 个物体的排列方式数量。例如，对于 $A$ 、 $B$ 、 $C$ 三个物体，共有 6 种排列方式：

$A BC$
$A CB$
$B A C$
$BC A$
$C A B$
$CB A$

另一种理解方式是：将三个物体依次放入三个位置。第一个位置有 3 种选择；当第一个位置确定后，第二个位置有 2 种选择；当第二个位置确定后，最后一个位置只有 1 种选择，即 $\times 2 \times 1$ ，这就是 $3!$ 的含义。因此，

$\times (n - 1) \times (n - 2) \times \cdots \times 2 \times 1$

需要注意以下三点：

阶乘的定义通常以递归形式表示：

$\times (n - 1)! \quad \text{且} \quad 0! = 1$

$0! = 1$ 是直观的。如果 $n!$ 表示 $n$ 个物体的排列方式数量，那么 $0!$ 表示 0 个物体的排列方式数量，答案是 1 种，即“空白”。
阶乘通常用于正整数和 0。如果需要讨论任意实数，则需要引入伽马函数（Gamma Function），此处不展开讨论。

排列 (Permutation)，记作 ${}^nP_r$ ，表示从 $n$ 个物体中选取 $r$ 个进行排列的方式数量。例如，从 $A$ 、 $B$ 、 $C$ 中选取 1 个进行排列，有 3 种方式：

如果选取 2 个进行排列，则有 6 种方式：

$A B$
$A C$
$B A$
$BC$
$C A$
$CB$

排列的公式为：

${}^nP_r = \frac{n!}{(n - r)!}$

其含义是：对 $n$ 个物体进行排列，但对 $(n - r)$ 个物体的排列“不在意”，因此将其除掉。

组合 (Combination)，记作 ${}^nC_r$ ，表示从 $n$ 个物体中选取 $r$ 个的方式数量。其公式为：

${}^nC_r = \frac{n!}{(n - r)! r!} = \frac{{}^nP_r}{r!}$

组合的含义是：对 $n$ 个物体进行排列，但对 $(n - r)$ 个物体的排列“不在意”，同时对选取的 $r$ 个物体的排列也“不在意”。换言之，放入坑中的物体的排列顺序无关紧要。这就是组合的定义。

更常见的解释是：组合表示“挑选”的方式数量。例如，从 $A$ 、 $B$ 、 $C$ 三个物体中挑选 2 个，有 3 种方式：

$A B$
$A C$
$BC$

计算过程如下：

${}^3C_2 = \frac{{}^3P_2}{2!} = \frac{3!}{(3 - 2)! 2!} = \frac{3 \times 2 \times 1}{1 \times 2 \times 1} = 3$

组合公式通常写为：

${}^nC_k = \frac{n!}{(n - r)! r!} = \frac{n \times (n - 1) \times \cdots \times (n - r + 1)}{r!}$

回到多项式函数的讨论：

$h)^n = x^n + n x^{n - 1} h + \frac{n(n - 1)}{2} x^{n - 2} h^2 + \cdots$

因此，

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{a(x^n + n x^{n - 1} h + \frac{n(n - 1)}{2} x^{n - 2} h^2 + \cdots) - a x^n}{h}\\ &= \lim_{h \rightarrow 0} \frac{a x^n + a n x^{n - 1} h + a \frac{n(n - 1)}{2} x^{n - 2} h^2 + \cdots - a x^n}{h}\\ &= \lim_{h \rightarrow 0} a n x^{n - 1} + a \frac{n(n - 1)}{2} x^{n - 2} h + \cdots \end{aligned}$

由于极限仅作用于第一项，因此最终结果为：

$x^n \quad \Rightarrow \quad \frac{df}{dx} = a n x^{n - 1}$

多项式函数（幂为负整数）

许多学生直接使用上述公式，部分学生知道推导过程，但当被问及“当 $n$ 为负数或分数时，该公式是否仍然适用？”时，他们往往会感到困惑。虽然大家都知道公式仍然适用，但上述推导是否要求 $n > 0$ 呢？

因此，当 $n$ 为负数或分数时，需要分别进行推导。

设函数 $f(x) = a x^{-n}$ ，其中 $n$ 为正整数，公式中添加负号以保持美观。按照惯例，有：

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h} \\ &= \lim_{h \rightarrow 0} \frac{a(x + h)^{-n} - a x^{-n}}{h} \end{aligned}$

在展开时遇到问题。此时需要引入牛顿的广义二项式定理（Binomial Theorem）。

广义二项式定理

为了简化表达，在讨论负数幂或分数幂的展开时，通常将数值较大的项提取出来。

$h)^{-n} = x^{-n} \left(1 + \frac{h}{x}\right)^{-n}$

因此，关注的是 $\left(1 + \frac{h}{x}\right)^{-n}$ 这一部分。

当幂为正整数时，展开式为：

$r)^n = 1 + n r + \frac{n(n - 1)}{2} r^2 + \cdots + \frac{n(n - 1)}{2} r^{n - 2} + n r^{n - 1} + r^n$

这是一个有限的展开式，且应用组合公式是合理的。

然而，当幂为负数时，为何仍可如此展开呢？在理清数理逻辑之前，牛顿并未过多纠结，而是直接使用了该方法。

$r)^{-n} = 1 + (-n) r + \frac{-n(-n - 1)}{2} r^2 + \frac{-n(-n - 1)(-n - 2)}{3!} r^3 + \cdots$

例如，当 $- n = - 1$ 时：

$r)^{-1} = 1 - r + r^2 - r^3 + \cdots$

可以看出，这是一个无限级数，包含无限项。但这是否合理呢？牛顿表示“似乎可以”。

$\times (1 + r)^{-1} = \frac{(1 + r)}{(1 + r)} = 1$

对于展开式进行乘法运算时，需要注意处理无限项的情况，确保项的对应关系正确：

$\begin{aligned} (1 + r) \times (1 - r + r^2 - r^3 + \cdots) &= 1 \times (1 - r + r^2 - r^3 + \cdots) + r \times (1 - r + r^2 - r^3 + \cdots)\\ &= (1 - r + r^2 - r^3 + \cdots) + (r - r^2 + r^3 - \cdots) \\ &= 1 \end{aligned}$

从第二项开始，各项相互抵消，最终只剩下 1。如果对消项过程感到困惑（“不应该差一项吗？”），可以借此机会深入理解“无限”的概念。牛顿认为， $1 + r)^{-1}$ 与 $(1 + r)$ 相乘得到 1，二者互为逆元，而无限项也具有这一性质，因此可以认为该无限级数与 $1 + r)^{-1}$ 等效。

回到问题：

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{a(x + h)^{-n} - a x^{-n}}{h} \\ &= \lim_{h \rightarrow 0} \frac{a x^{-n} \left(1 + \frac{h}{x}\right)^{-n} - a x^{-n}}{h}\\ &= \lim_{h \rightarrow 0} \frac{a x^{-n} \left(1 - n \frac{h}{x} + \frac{n(n + 1)}{2} \left(\frac{h}{x}\right)^2 - \cdots \right) - a x^{-n}}{h}\\ &= \lim_{h \rightarrow 0} \frac{-n a x^{-n} \frac{h}{x} + \frac{n(n + 1)}{2} a x^{-n} \left(\frac{h}{x}\right)^2 - \cdots}{h}\\ &= \lim_{h \rightarrow 0} -n a x^{-n - 1} + \frac{n(n + 1)}{2} a x^{-n - 2} h - \cdots\\ \end{aligned}$

第一项不受极限影响，因此最终结果为：

$x^{-n} \quad \Rightarrow \quad \frac{df}{dx} = -n a x^{-n - 1}$

多项式函数（幂为分数）

设函数 $x^{\frac{1}{n}}$ 。

可以使用牛顿的广义二项式定理。此处采用另一种方法进行推导，同时引入微分中两个重要的方法。

链式法则

链式法则 (Chain Rule) 是微积分中极为重要的法则之一（另一个将在下文提到；此处虽仅讨论微分，但换元积分法本质上是链式法则的逆运算）。用一种可能令数学系读者不满的写法表示为：

$\frac{df}{dx} = \frac{df}{dm} \frac{dm}{dn} \frac{dn}{dp} \frac{dp}{dq} \frac{dq}{dx}$

中间的项如同链条一般，将 $df$ 与 $d x$ 连接起来。

例如，对于函数 $f(x) = (x^2 + 6x)^{-3}$ ，进行微分时，与其展开，不如使用链式法则，轻松解决问题。

令 $u = x^2 + 6x$ ，则：

$\frac{du}{dx} = 2x + 6$

$u^{-3} \quad \Rightarrow \quad \frac{df}{du} = -3 u^{-4}$

$\frac{df}{dx} = \frac{df}{du} \frac{du}{dx} = -3 u^{-4} (2x + 6)$

最终，需要得到关于 $x$ 的表达式：

$\frac{df}{dx} = -3 (2x + 6) (x^2 + 6x)^{-4}$

链式法则在处理复杂微分问题时极为重要，熟练掌握后，许多思考过程可以在脑内完成，并“跳过”某些步骤。

隐函数微分

隐函数微分 (Implicit Differentiation) 在许多场合中具有重要作用，且具有深刻的含义。这些内容可以慢慢体会，此处仅讨论一个简单的情况。

假设 $y^2 = x^3$ ，求 $\frac{dy}{dx}$ 。当然，可以将 2 从 $y$ 移到 $x$ 的右侧，得到 $x^{\frac{3}{2}}$ ，然后进行微分，得到 $\frac{dy}{dx} = \frac{3}{2} x^{\frac{1}{2}}$ 。但还可以采用另一种方法：

直接对两边进行微分，但需明确是对 $x$ 进行微分：

$\frac{d}{dx}(y^2) = \frac{d}{dx}(x^3)$

左侧是一个关于 $y$ 的函数，即 $f(y) = y^2$ ，因此不能直接对 $x$ 进行微分，但可以使用链式法则：

$\frac{d}{dy}(y^2) \frac{dy}{dx} = \frac{d}{dx}(x^3)$

$\frac{dy}{dx} = 3x^2$

$\frac{dy}{dx} = \frac{3}{2} \frac{x^2}{y}$

由于 $x^{\frac{3}{2}}$ ，因此：

$\frac{dy}{dx} = \frac{3}{2} \frac{x^2}{y} = \frac{3}{2} \frac{x^2}{x^{\frac{3}{2}}} = \frac{3}{2} x^{2 - \frac{3}{2}} = \frac{3}{2} x^{\frac{1}{2}}$

此处可能觉得隐函数微分没有必要，甚至有些繁琐。但事实上，可以利用之前学过的内容来处理更复杂的情况。

回到多项式函数的讨论：

$x^{\frac{1}{n}} \quad \Rightarrow \quad [f(x)]^n = a^n x$

此处多用一个括号，以明确 $f(x)]^n$ 表示 $f (x)$ 的值的 $n$ 次方。实际上，写成 $y^n$ 更为合适，因为 $f^n(x)$ 在某些场合下可能被误解为进行了 $n$ 次微分。

接下来进行隐函数微分：

$\frac{d}{dx}(y^n) = \frac{d}{dx}(a^n x)$

$\frac{d}{dy}(y^n) \frac{dy}{dx} = a^n$

$y^{n - 1} \frac{dy}{dx} = a^n$

$\frac{dy}{dx} = \frac{a^n}{n y^{n - 1}}$

$\frac{dy}{dx} = \frac{a^n}{n (a x^{\frac{1}{n}})^{n - 1}}$

$\frac{dy}{dx} = \frac{a}{n x^{\frac{n - 1}{n}}}$

$\frac{dy}{dx} = \frac{a}{n} x^{-\frac{n - 1}{n}}$

$\frac{dy}{dx} = \frac{a}{n} x^{-1 + \frac{1}{n}}$

因此，最终结果为：

$x^{\frac{1}{n}} \quad \Rightarrow \quad \frac{df}{dx} = a \frac{1}{n} x^{\frac{1}{n} - 1}$

至此，完成了多项式函数的证明，所有多项式的情况均满足最初看到的公式，可以放心使用：

$x^n \quad \Rightarrow \quad \frac{df}{dx} = a n x^{n - 1}$

三角函数（正弦函数）

正弦函数 (Sine Function, Sinusoidal Functions)

设函数 $\sin(kx)$ ，其中 $k$ 为任意常数。按照之前的流程，有：

$\frac{df}{dx} = \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h} = \lim_{h \rightarrow 0} \frac{\sin(kx + k h) - \sin(kx)}{h}$

同样需要展开，此时使用和角公式。

和角公式

根据下图：

和角公式

由于矩形的对边相等，因此有：

$\sin(\alpha + \beta) = \sin(\alpha) \cos(\beta) + \cos(\alpha) \sin(\beta)$

$\cos(\alpha + \beta) = \cos(\alpha) \cos(\beta) - \sin(\alpha) \sin(\beta)$

如果角度大于 $\frac{\pi}{2}$ ，可以在圆上进行证明，但此处不展开讨论。

如果需要计算差角公式，可以使用以下公式：

$\sin(-\theta) = -\sin(\theta)$

$\cos(-\theta) = \cos(\theta)$

将上述公式代入即可。原则上，不建议背诵任何带有负号的公式，因为一旦搞错被减数和减数，再多的努力也将付诸东流。

回到正弦函数的讨论：

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{\sin(kx) \cos(kh) + \cos(kx) \sin(kh) - \sin(kx)}{h} \\ &= \lim_{h \rightarrow 0} \left( \sin(kx) \frac{\cos(kh) - 1}{h} + \cos(kx) \frac{\sin(kh)}{h} \right) \end{aligned}$

$k x$ 不受 $\lim_{h \rightarrow 0}$ 的影响，因此只需考虑那两个分数的极限情况。

当 $\rightarrow 0$ 时，两个分数均趋近于 $\frac{0}{0}$ ，因此一个常见的错误是使用洛必达法则 (L’Hôpital’s Rule)。如果 $\lim_{x \rightarrow c} \frac{f(x)}{g(x)} \rightarrow \frac{0}{0}$ 或 $\frac{\infty}{\infty}$ ，则有：

$\lim_{x \rightarrow c} \frac{f(x)}{g(x)} = \lim_{x \rightarrow c} \frac{f'(x)}{g'(x)}$

洛必达法则非常实用，但它要求已知相关函数的微分。此处正在证明 $\sin$ 的微分，因此不能使用洛必达法则。

因此，需要使用另外两个工具：单位圆 (Unit Circle) 和 夹逼定理 (Squeeze Theorem)。

单位圆

单位圆的核心在于将抽象的三角函数具体化。回想一下正弦、余弦和正切的定义，它们实际上是直角三角形三边之间的比例关系，而比例是一个较为抽象的概念。相反，单位圆是一个半径为 1 的圆，通过以下思考方式，可以轻松地将复杂的比例关系简化为线段长度与角度之间的变换关系。需要注意的是，单位圆默认角度是逆时针旋转，且角度单位为弧度。

正弦是对边与斜边的比值，而此时斜边为 1，因此正弦变为对边的实际长度：
$\sin(\theta) = \frac{\text{opp.}}{\text{hyp.}} = \frac{\text{opp.}}{1} = \text{opp.}$

单位圆与正弦

同样，余弦是邻边与斜边的比值，斜边为 1，因此余弦变为邻边的实际长度：

$\cos(\theta) = \frac{\text{adj.}}{\text{hyp.}} = \frac{\text{adj.}}{1} = \text{adj.}$

单位圆与余弦

类似地，正切是对边与邻边的比值，只要让邻边为 1，那么正切就变为对边的实际长度：

$\tan(\theta) = \frac{\text{opp.}}{\text{adj.}} = \frac{\text{opp.}}{1} = \text{opp}$

单位圆与正切

因此，构图要清晰，明确让哪条边为 1。单位圆的思想在处理许多三角函数问题时极为巧妙。

其中：

opp. 表示“对边”（opposite side），即直角三角形中与角 $\theta$ 对应的边。
adj. 表示“邻边”（adjacent side），即直角三角形中与角 $\theta$ 相邻的边。
hyp. 表示“斜边”（hypotenuse），即直角三角形中最长的边，与直角相对的边。

夹逼定理

通过上述单位圆的简单构图：

单位圆与夹逼定理

在 $\leq \theta < \frac{\pi}{2}$ 时，有：

$\sin(\theta) \leq \theta \leq \tan(\theta)$

因此，可以进行如下操作：

$\sin(\theta) \leq \theta \leq \frac{\sin(\theta)}{\cos(\theta)}$

$\leq \frac{\theta}{\sin(\theta)} \leq \frac{1}{\cos(\theta)}$

$\geq \frac{\sin(\theta)}{\theta} \geq \cos(\theta)$

这是一个有趣的不等式，中间项是想要分析的项。当 $\theta \rightarrow 0$ 时，知道 $\cos(\theta) \rightarrow 1$ 是确定的，因此中间项既小于等于 1，又大于等于 1，最终只能等于 1。这就是夹逼定理的思想。

因此，得到：

$\lim_{h \rightarrow 0} \frac{\sin(k h)}{h} = k \left( \lim_{h \rightarrow 0} \frac{\sin(k h)}{k h} \right) = k \cdot 1 = k$

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \sin(k x) \frac{\cos(k h) - 1}{h} + \cos(k x) \frac{\sin(k h)}{h} \\ &= k \sin(k x) \left( \lim_{h \rightarrow 0} \frac{\cos(k h) - 1}{k h} \right) + k \cos(k x) \end{aligned}$

还剩下另一部分，可以简单处理如下：

$\frac{\cos(\theta) - 1}{\theta}$

由于 $\cos^2(\theta) + \sin^2(\theta) = 1$ ，因此：

$\frac{(\cos(\theta) - 1)(\cos(\theta) + 1)}{\theta (\cos(\theta) + 1)} = \frac{\cos^2(\theta) - 1}{\theta (\cos(\theta) + 1)} = -\frac{\sin(\theta)}{\theta} \frac{\sin(\theta)}{\cos(\theta) + 1}$

当 $\theta \rightarrow 0$ 时， $\frac{\sin(\theta)}{\theta}$ 、 $\sin(\theta)$ 和 $\cos(\theta) + 1$ 分别趋近于 1、0 和 2，整体则趋近于 0。

因此：

$\begin{aligned} \frac{df}{dx} & =k\sin (kx)\left( \underset{h\to 0}{\mathop{\lim }}\,\frac{\cos (kh)-1}{kh} \right)+k\cos (kx) \\ & =k\sin (kx)\cdot 0+k\cos (kx) \end{aligned}$

最终结果为：

$\sin(k x) \quad \Rightarrow \quad \frac{df}{dx} = k \cos(k x)$

三角函数（余弦函数）

设函数 $\cos(k x)$ 。

对于余弦函数 (Cosine Function)，自然也可以走上面的老路。但也可以复用上面的结论，只要你意识到余弦和正弦之间就是一个 $\frac{\pi}{2}$ 的相位差，即

$\cos(k x) = \sin(k x + \frac{\pi}{2})$

那么只需要简单的链式法则一下，令 $\frac{\pi}{2} \Rightarrow \frac{du}{dx} = k$ ，

$\sin(u) \Rightarrow \frac{df}{du} = \cos(u)$

因此，

$\frac{df}{dx} = \frac{df}{du} \frac{du}{dx} = k \cos(k x + \frac{\pi}{2})$

而如果 $\cos$ 函数再往 $- x$ 方向移动 $\frac{\pi}{2}$ 个单位的话，那么就变成 $-\sin$ 了，所以，

$\cos(k x) \quad \Rightarrow \quad \frac{df}{dx} = -k \sin(k x)$

三角函数（正切函数）

正切函数 (Tangent Function)

设函数 $\tan(k x)$ 。

正切函数这里引入微积分另一个重要的法则：乘法法则 (Product Rule)。

乘法法则

如果 $f (x) = u (x) v (x)$ ，那么如何求得 $\frac{df}{dx}$ ？代入

$\begin{aligned} \frac{df}{dx} &= \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h} \\ &= \lim_{h \rightarrow 0} \frac{u(x + h) v(x + h) - u(x) v(x)}{h}\\ &= \lim_{h \rightarrow 0} \frac{u(x + h) v(x + h) - u(x) v(x) + u(x) v(x + h) - u(x) v(x + h)}{h}\\ &= \lim_{h \rightarrow 0} \frac{u(x + h) v(x + h) - u(x) v(x + h)}{h} + \frac{u(x) v(x + h) - u(x) v(x)}{h}\\ &= \lim_{h \rightarrow 0} \frac{u(x + h) - u(x)}{h} v(x + h) + u(x) \frac{v(x + h) - v(x)}{h} \end{aligned}$

可以看出，前一项中

$\lim_{h \rightarrow 0} \frac{u(x + h) - u(x)}{h} = \frac{du}{dx}$

$\lim_{h \rightarrow 0} v(x + h) = v(x)$

第二项中

$\lim_{h \rightarrow 0} \frac{v(x + h) - v(x)}{h} = \frac{dv}{dx}$

因此，最终结果为：

$\quad \Rightarrow \quad \frac{df}{dx} = u v' + u' v$

除法法则

除法法则 (Quotient Rule) 是一个我从未背过，也觉得没必要背的法则。用乘法法则去解决并不比除法法则多几步操作，而且除法法则公式中还有负号，就像之前说的，背反就前功尽弃。

这里写下是为了等下用，但其实就可以当成做了一次乘法法则。

如果 $\frac{u(x)}{v(x)}$ ，去求 $\frac{df}{dx}$ ，

本质上， $\frac{u(x)}{v(x)} = u(x) (v(x))^{-1}$ ，所以

$\begin{aligned} \frac{df}{dx} & =u\frac{d}{dx}\left( {{v}^{-1}} \right)+\frac{du}{dx}{{v}^{-1}} \\ & =u\frac{d}{dv}\left( {{v}^{-1}} \right)\frac{dv}{dx}+\frac{du}{dx}\frac{1}{v} \\ & =-u\frac{1}{{{v}^{2}}}\frac{dv}{dx}+\frac{du}{dx}\frac{1}{v} \end{aligned}$

因此，

$\frac{u(x)}{v(x)} \quad \Rightarrow \quad \frac{df}{dx} = \frac{v u' - u v'}{v^2}$

回到推导，因为

$\tan(k x) = \frac{\sin(k x)}{\cos(k x)}$

令 $\sin(k x)$ ， $\cos(k x)$ ，所以

$\begin{aligned} \frac{df}{dx} & =\frac{v{u}'-u{v}'}{{{v}^{2}}} \\ & =\frac{\cos (kx)k\cos (kx)-\sin (kx)k(-\sin (kx))}{{{\cos }^{2}}(kx)} \\ & =k\frac{{{\cos }^{2}}(kx)+{{\sin }^{2}}(kx)}{{{\cos }^{2}}(kx)}=k\frac{1}{{{\cos }^{2}}(kx)} \end{aligned}$

因此，

$\tan(k x) \quad \Rightarrow \quad \frac{df}{dx} = k \sec^2(k x)$

至此，主要的三个三角函数的微分已经完成。其余的三角函数（如正割、余割、余切）分别是前三者的倒数，因此只需多代一次链式法则即可。

指数函数

指数函数 (Exponential Function)

设函数 $a^{\lambda x}$ ，其中 $a$ 和 $\lambda$ 是常数。

按照之前的流程：

$\frac{df}{dx} = \lim_{h \rightarrow 0} \frac{f(x + h) - f(x)}{h} = \lim_{h \rightarrow 0} \frac{a^{\lambda (x + h)} - a^{\lambda x}}{h} = \lim_{h \rightarrow 0} \frac{a^{\lambda x} a^{\lambda h} - a^{\lambda x}}{h} = a^{\lambda x} \lim_{h \rightarrow 0} \frac{a^{\lambda h} - 1}{h}$

从最后的表达式中可以看出，指数函数具有一个神奇的性质：

$\frac{df}{dx} \propto f$

自然常数

当然，遇到这种情况，大家一定会去寻找一个最特殊的情况，即

$\frac{df}{dx} = f$

换言之，

$\lim_{h \rightarrow 0} \frac{a^{\lambda h} - 1}{h} = 1$

这里先默认 $\lambda = 1$ ，原因有二：一是 $\lambda$ 之后可以通过链式法则解决；二是更重要的是，只有一个公式，无法同时解两个变量。

$\lim_{h \rightarrow 0} \frac{a^{h} - 1}{h} = 1$

$\lim_{h \rightarrow 0} a^{h} = \lim_{h \rightarrow 0} h + 1$

两边同时开方：

$\lim_{h \rightarrow 0} a^{h} = \lim_{h \rightarrow 0} h + 1$

$\lim_{h \rightarrow 0} (h + 1)^{\frac{1}{h}}$

这是一个什么数字呢？

可以做如下变换，令 $\frac{1}{N}$ ，这样当 $\rightarrow 0$ 时等效于 $\rightarrow \infty$ （假设 $h$ 从数轴正半轴趋近于 0），因此：

$\lim_{N \rightarrow \infty} \left(1 + \frac{1}{N}\right)^{N}$

接下来列出一个表格：

$N$	$a$
1	2.0
10	2.593742
1,000	2.716924
1,000,000	2.718280
1,000,000,000	2.718282

可以看出这个数值趋近于 2.718 几，而这个数就是对诸多领域都极为关键的自然常数 (Natural Constant) $e$ ，当然，也叫欧拉数 (Euler’s Number)。没办法，欧拉真是无处不在。

而

$\lim_{N \rightarrow \infty} \left(1 + \frac{1}{N}\right)^{N}$

也可以被视为欧拉数的定义。

但对于目前而言，这个欧拉数最大的意义是，以它为底时的微分是它自己本身（如果 $\lambda = 1$ 的话），加上链式法则，就有：

$e^{\lambda x} \quad \Rightarrow \quad \frac{df}{dx} = \lambda e^{\lambda x}$

那么对于一般的 $\neq e$ 呢？两边同时取对数即可。

对数函数 (Logarithmic Function) 是指数函数的逆运算。也就是说，

$a^{x} \quad \Rightarrow \quad \log_{a}(y) = x \quad \Rightarrow \quad f^{-1}(x) = y = \log_{a}(x)$

而如果底数为欧拉数 $e$ ，即 $log_{e}$ ，那么在物理学中通常写作 $\ln$ ，也就是自然对数 (Natural Logarithm)。而在计算机领域中，许多地方直接写作 $\log$ ，例如 NumPy log 函数（当然，在计算机领域中，如果看到有人直接使用 $\log$ ，最好问清楚其具体含义，因为有时默认底数为 2 或 10）。

回过头来，

$a^{\lambda x} = e^{\ln(a) \lambda x}$

因此，

$a^{\lambda x} \quad \Rightarrow \quad \frac{df}{dx} = \lambda \ln(a) a^{\lambda x}$

对数函数

设函数 $\log_{a}(\lambda x)$ 。

同样，先讨论比较特殊的情况，即自然对数的情况。

设 $\ln(\lambda x)$ 。基本上，这个推导大家都会心照不宣地选择隐函数微分，此处也采用这种方法：

$\begin{aligned} y & =\ln (\lambda x)\quad \\ & \Rightarrow \quad {{e}^{y}}=\lambda x\quad \\ & \Rightarrow \quad \frac{d}{dx}({{e}^{y}})=\frac{d}{dx}(\lambda x)\quad \\ & \Rightarrow \quad \frac{d}{dy}({{e}^{y}})\frac{dy}{dx}=\lambda \quad \\ & \Rightarrow \quad {{e}^{y}}\frac{dy}{dx}=\lambda \quad \\ & \Rightarrow \quad \lambda x\frac{dy}{dx}=\lambda \quad \\ & \Rightarrow \quad \frac{dy}{dx}=\frac{1}{x} \end{aligned}$

那么对于一般的 $a$ 的情况，就需要用到换底公式了。

换底公式

我始终认为有一些公式被创造出来就是让人背的。我并不觉得记住这种公式能提升多少计算速度，但它被当作一个公式搞得煞有介事。换底公式就是这样的公式之一。

如果
$\begin{aligned} k&={{\log }_{a}}(c)\quad \\ & \Rightarrow \quad {{a}^{k}}=c\quad \\ & \Rightarrow \quad {{\log }_{b}}({{a}^{k}})={{\log }_{b}}(c)\quad \\ & \Rightarrow \quad k{{\log }_{b}}(a)={{\log }_{b}}(c)\quad \\ & \Rightarrow \quad k=\frac{{{\log }_{b}}(c)}{{{\log }_{b}}(a)} \\ \end{aligned}$

这就是所谓的换底公式：

$\log_{a}(c) = \frac{\log_{b}(c)}{\log_{b}(a)}$

代入换底公式：

$\log_{a}(\lambda x) = \frac{\ln(\lambda x)}{\ln(a)}$

因此，

$\log_{a}(\lambda x) \quad \Rightarrow \quad \frac{df}{dx} = \frac{1}{\ln(a)} \cdot \frac{1}{x}$

双曲三角函数

关于双曲三角函数 (Hyperbolic Trigonometric Functions)，最好先一口气把定义放出来。

双曲余弦函数

双曲余弦函数 (Hyperbolic Cosine Function)

$\cosh(k x) = \frac{e^{k x} + e^{-k x}}{2}$

双曲正弦函数

双曲正弦函数 (Hyperbolic Sine Function)

$\sinh(k x) = \frac{e^{k x} - e^{-k x}}{2}$

双曲正切函数

双曲正切函数 (Hyperbolic Tangent Function)

$\begin{aligned} f(x) &= \tanh(k x) \\ &= \frac{\sinh(k x)}{\cosh(k x)} \\ &= \frac{e^{k x} - e^{-k x}}{e^{k x} + e^{-k x}} \\ &= \frac{e^{2 k x} - 1}{e^{2 k x} + 1} \end{aligned}$

其实写到这里有点多余，因为有了上面的定义，只需使用基本的链式法则和乘法法则即可解决。

所以这里只做双曲正切函数的推导：

$\tanh(k x) = \frac{e^{k x} - e^{-k x}}{e^{k x} + e^{-k x}}$

$\begin{aligned} \frac{df}{dx} &= \frac{d}{dx}(e^{k x} - e^{-k x}) \cdot \frac{1}{e^{k x} + e^{-k x}} + (e^{k x} - e^{-k x}) \cdot \frac{d}{dx}\left(\frac{1}{e^{k x} + e^{-k x}}\right) \\ &= k \left( e^{k x} + e^{-k x} \right) \cdot \frac{1}{e^{k x} + e^{-k x}} - (e^{k x} - e^{-k x}) \cdot \frac{d}{dx}(e^{k x} + e^{-k x}) \cdot \frac{1}{(e^{k x} + e^{-k x})^2} \\ &= k \cdot 1 - \frac{(e^{k x} - e^{-k x}) \cdot k (e^{k x} - e^{-k x})}{(e^{k x} + e^{-k x})^2} \\ &= k - k \frac{(e^{k x} - e^{-k x})^2}{(e^{k x} + e^{-k x})^2} \\ &= k \left( \frac{(e^{k x} + e^{-k x})^2 - (e^{k x} - e^{-k x})^2}{(e^{k x} + e^{-k x})^2} \right) \\ &= k \left( \frac{e^{2 k x} + 2 + e^{-2 k x} - (e^{2 k x} - 2 + e^{-2 k x})}{(e^{k x} + e^{-k x})^2} \right) \\ &= k \left( \frac{4}{(e^{k x} + e^{-k x})^2} \right) \\ &= k \left( \frac{2}{e^{k x} + e^{-k x}} \right)^2 \\ &= k \frac{1}{\cosh^2(k x)} \end{aligned}$

双曲三角函数的命名与三角函数一致，因此可以简单地写成：

$\tanh(k x) \quad \Rightarrow \quad \frac{df}{dx} = k \, \mathbf{sech}^{2}(k x)$

编辑于 2024-03-09 16:28・上海

via：

【回归本源】给微积分入门者的小记 - 知乎
https://zhuanlan.zhihu.com/p/609087301
- 圆周率的神奇算法【官方双语】【Veritasium真理元素】_哔哩哔哩_bilibili
  https://www.bilibili.com/video/BV1x64y1D7Rn/