說明:本文最後一部分是鏈式法則的證明,可以直接讀最後一部分。我的狀態是重讀高數,所以追溯術語定義。
無窮小的和差積是無窮小,但是兩個無窮小的商會出現不同的情況。例如,當 x → 0 x\rightarrow 0 x→0時, 3 x 3x 3x、 x 2 x^2 x2、 sin x \sin{x} sinx都是無窮小,而 lim x → 0 x 2 3 x = 0 \lim \limits_{x\rightarrow 0}\frac{x^2}{3x}=0 x→0lim3xx2=0, lim x → 0 3 x x 2 = ∞ \lim \limits_{x\rightarrow 0}\frac{3x}{x^2}=\infty x→0limx23x=∞, lim x → 0 sin x 3 x = 1 3 \lim \limits_{x\rightarrow 0}\frac{\sin{x}}{3x}=\frac{1}{3} x→0lim3xsinx=31(註: lim x → 0 sin x x = 1 \lim \limits_{x\rightarrow 0}\frac{\sin{x}}{x}=1 x→0limxsinx=1,本文不作證明)。
定義:
如果
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
0
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=0
(or)x→∞x→x0limαβ=0,那麽就說
β
\beta
β是比
α
\alpha
α高階的無窮小,記作
β
=
o
(
α
)
\beta=o(\alpha)
β=o(α)。
如果
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
∞
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\infty
(or)x→∞x→x0limαβ=∞,那麽就說
β
\beta
β是比
α
\alpha
α低階的無窮小。
如果
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
c
≠
0
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=c\ne 0
(or)x→∞x→x0limαβ=c=0,那麽就說
β
\beta
β與
α
\alpha
α是同階的無窮小。
如果
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
k
=
c
≠
0
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha^k}=c\ne 0
(or)x→∞x→x0limαkβ=c=0,
k
>
0
k>0
k>0,那麽就說
β
\beta
β是關於
α
\alpha
α的
k
k
k階的無窮小。
如果
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
1
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=1
(or)x→∞x→x0limαβ=1,那麽就說
β
\beta
β與
α
\alpha
α是等價無窮小,記作
α
∼
β
\alpha\sim \beta
α∼β。
等價無窮小有兩個定理。
定理1
β
\beta
β與
α
\alpha
α是等價無窮小的充分必要條件為
β
=
α
+
o
(
α
)
\beta=\alpha+o(\alpha)
β=α+o(α)。
證:
⇒
]
\Rightarrow ]
⇒]必要性。
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
1
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=1
(or)x→∞x→x0limαβ=1,
lim
x
→
x
0
(
o
r
)
x
→
∞
β
−
α
α
=
0
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta-\alpha}{\alpha}=0
(or)x→∞x→x0limαβ−α=0,
β
−
α
=
o
(
α
)
\beta-\alpha=o(\alpha)
β−α=o(α),
β
=
α
+
o
(
α
)
\beta=\alpha+o(\alpha)
β=α+o(α)。
⇐
]
\Leftarrow ]
⇐]充分性。
β
−
α
=
o
(
α
)
\beta-\alpha=o(\alpha)
β−α=o(α),
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
lim
x
→
x
0
(
o
r
)
x
→
∞
α
+
o
(
α
)
α
=
lim
x
→
x
0
(
o
r
)
x
→
∞
(
1
+
o
(
α
)
α
)
=
1
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\alpha+o(\alpha)}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}(1+\frac{o(\alpha)}{\alpha})=1
(or)x→∞x→x0limαβ=(or)x→∞x→x0limαα+o(α)=(or)x→∞x→x0lim(1+αo(α))=1。
定理2 設
α
∼
α
˜
\alpha\sim \~\alpha
α∼α˜,
β
∼
β
˜
\beta\sim\~\beta
β∼β˜,且
lim
x
→
x
0
(
o
r
)
x
→
∞
β
˜
α
˜
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha}
(or)x→∞x→x0limα˜β˜存在,
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
=
lim
x
→
x
0
(
o
r
)
x
→
∞
β
˜
α
˜
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha}
(or)x→∞x→x0limαβ=(or)x→∞x→x0limα˜β˜。
證:
lim
x
→
x
0
(
o
r
)
x
→
∞
β
˜
α
˜
=
lim
x
→
x
0
(
o
r
)
x
→
∞
β
˜
β
β
α
α
α
˜
=
lim
x
→
x
0
(
o
r
)
x
→
∞
β
˜
β
lim
x
→
x
0
(
o
r
)
x
→
∞
β
α
lim
x
→
x
0
(
o
r
)
x
→
∞
α
α
˜
\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\beta}\frac{\beta}{\alpha}\frac{\alpha}{\~\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\beta}\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\alpha}{\~\alpha}
(or)x→∞x→x0limα˜β˜=(or)x→∞x→x0limββ˜αβα˜α=(or)x→∞x→x0limββ˜(or)x→∞x→x0limαβ(or)x→∞x→x0limα˜α
我們來看近一點無窮小 α \alpha α。
1)無窮小有無窮小函數或無窮小數列,這裏 α \alpha α是無窮小函數。雖然看上去是單個字母,但是我們要清楚這個字母表示函數,我們要在心裏翻譯成有自變量的函數,比如自變量用 x x x表示,即 α = α ( x ) \alpha=\alpha(x) α=α(x)。我們說 α ( x ) \alpha(x) α(x)是無窮小具體什麼意思呢?當 x → x 0 x \rightarrow x_0 x→x0, α ( x ) → 0 \alpha(x) \rightarrow 0 α(x)→0,即 lim x → x 0 α ( x ) = 0 \lim \limits_{x \rightarrow x_0}\alpha(x)=0 x→x0limα(x)=0
2) β ∼ α \beta \sim \alpha β∼α,則 β = α + o ( α ) \beta= \alpha+o(\alpha) β=α+o(α),特別地, α ∼ α + o ( α ) \alpha \sim \alpha+o(\alpha) α∼α+o(α)。例如,當 x → 0 x \rightarrow 0 x→0,例如 3 x ∼ 3 x + x 2 3x \sim 3x+x^2 3x∼3x+x2,當 x → 0 x\rightarrow 0 x→0。
3)如果 lim x → x 0 ( o r ) x → ∞ β α = 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=0 (or)x→∞x→x0limαβ=0,那麽就說 β \beta β是比 α \alpha α高階的無窮小,記作 β = o ( α ) \beta=o(\alpha) β=o(α)。
o ( α ) o(\alpha) o(α)直覺上是什麼意思呢?
By definition,無窮小
=
=
=函數求某一點極限、極限為
0
0
0。所以當我們談無窮小,我們必然指的是求極限,前提是自變量同一變化條件,即自變量
x
→
x
0
x\rightarrow x_0
x→x0,或者自變量
x
→
∞
x\rightarrow \infty
x→∞,但本段敘述,我們以
x
→
x
0
x\rightarrow x_0
x→x0為例。如果我們用泰勒展開式來理解,函數
f
(
x
)
f(x)
f(x)在
x
0
x_0
x0多階導數存在,那麽函數就可以展開成多項式,當
x
→
x
0
x\rightarrow x_0
x→x0,即一切
x
∈
U
˚
(
x
0
)
x\in \r{U}(x_0)
x∈U˚(x0),
f
(
x
)
=
f
(
x
0
)
+
f
′
(
x
0
)
(
x
−
x
0
)
+
f
′
′
(
x
0
)
2
!
(
x
−
x
0
)
+
.
.
.
+
f
(
n
)
(
x
0
)
n
!
(
x
−
x
0
)
n
+
.
.
.
f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+...
f(x)=f(x0)+f′(x0)(x−x0)+2!f′′(x0)(x−x0)+...+n!f(n)(x0)(x−x0)n+...。這裏的函數是任何函數,比如三角函數,或者看著很古怪很複雜的函數。這個事實很重要,因為對人手算和計算機CPU指令計算來說,只能加減乘除,我們不會算三角函數,CPU也不會,真正的計算是使用泰勒展開式,使函數變成多項式,再做人或CPU的計算。
所以我們想想看,兩個無窮小的比較,本質是每個函數的第一個
x
i
x^i
xi的比較,誰的冪
i
i
i更大,誰收斂得更快,誰就是更高階的無窮小。
如果 lim x → x 0 ( o r ) x → ∞ β α k = c ≠ 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha^k}=c\ne 0 (or)x→∞x→x0limαkβ=c=0, k > 0 k>0 k>0,那麽說 β \beta β是關於 α \alpha α的 k k k階的無窮小。假設我們以 y = x y=x y=x為例, α = α ( x ) = x \alpha=\alpha(x)=x α=α(x)=x, x → x 0 x\rightarrow x_0 x→x0,那麽, β \beta β是 α \alpha α的 k k k階無窮小指的是, β = β ( x ) \beta=\beta(x) β=β(x),在 x 0 x_0 x0的鄰域泰勒展開的話,最小冪次項 x k x^k xk。當然,如果 α = α ( x ) = x 2 \alpha=\alpha(x)=x^2 α=α(x)=x2,那麽 β = β ( x ) \beta=\beta(x) β=β(x)的泰勒展開式中最小冪次項 x 2 k x^{2k} x2k。
那如果 α = α ( x ) = x 2 \alpha=\alpha(x)=x^2 α=α(x)=x2, o ( α ) o(\alpha) o(α)直覺上是 x 3 x^3 x3、 x 4 x^4 x4,或者泰勒展開式中最小冪次項是 x 3 x^3 x3、 x 4 x^4 x4這樣的函數。 α = α ( x ) = x 7 \alpha=\alpha(x)=x^7 α=α(x)=x7, o ( α ) o(\alpha) o(α)直覺上 x 8 x^8 x8起。換句話說,當 x → 0 x\rightarrow 0 x→0, β \beta β是 o ( α ) o(\alpha) o(α),到底還是要用 x x x表示的函數, x x x的冪次比 α ( x ) \alpha(x) α(x)更高。這裏的討論, x → 0 x\rightarrow 0 x→0即泰勒展開式 ( x − x 0 ) → 0 (x-x_0) \rightarrow 0 (x−x0)→0,即 x → x 0 x\rightarrow x_0 x→x0。
我們來證明複合函數求導法則即鏈式法則(chain rule)。定義如下(參考附錄)——
鏈式法則 如果
u
=
g
(
x
)
u=g(x)
u=g(x) 在點
x
0
x_0
x0可導,而
y
=
f
(
u
)
y=f(u)
y=f(u)在點
u
0
=
g
(
x
0
)
u_0=g(x_0)
u0=g(x0)可導,則複合函數
u
=
f
[
g
(
x
)
]
u=f[g(x)]
u=f[g(x)]在點
x
0
x_0
x0可導,且導數為
d
y
d
x
∣
x
=
x
0
=
f
′
(
ϕ
(
x
0
)
)
⋅
ϕ
′
(
x
0
)
\frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(\phi(x_0))\cdot\phi'(x_0)
dxdy
x=x0=f′(ϕ(x0))⋅ϕ′(x0)
什麼是『可導』?
x → x 0 x \rightarrow x_0 x→x0,令 Δ x = x − x 0 \Delta x=x-x_0 Δx=x−x0, Δ y = f ( x ) − f ( x 0 ) = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x)-f(x_0)=f(x_0+\Delta x)-f(x_0) Δy=f(x)−f(x0)=f(x0+Δx)−f(x0)。
定義:設函數
y
=
f
(
x
)
y=f(x)
y=f(x)在點的某個鄰域內有定義,當自變量
x
x
x在
x
0
x_0
x0處得到增量
Δ
x
\Delta x
Δx(點
x
0
+
Δ
x
x_0+\Delta x
x0+Δx仍在該鄰域內)時,相應地,因變量取得增量
Δ
y
=
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
\Delta y=f(x_0+\Delta x)-f(x_0)
Δy=f(x0+Δx)−f(x0)。如果
Δ
y
\Delta y
Δy與
Δ
x
\Delta x
Δx之比當
Δ
x
→
0
\Delta x\rightarrow 0
Δx→0極限存在,那麽稱函數
y
=
f
(
x
)
y=f(x)
y=f(x)在
x
0
x_0
x0處可導,並稱這個極限為導數,記為
f
′
(
x
0
)
f'(x_0)
f′(x0),即
f
′
(
x
0
)
=
lim
Δ
x
→
0
Δ
y
Δ
x
=
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
f'(x_0)=\lim \limits_{\Delta x\rightarrow 0}\frac{\Delta y}{\Delta x}=\lim \limits_{\Delta x\rightarrow 0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}
f′(x0)=Δx→0limΔxΔy=Δx→0limΔxf(x0+Δx)−f(x0)
也可記作
y
′
∣
x
=
x
0
y'|_{x=x_0}
y′∣x=x0,
d
f
(
x
)
d
x
∣
x
=
x
0
\frac{d{f(x)}}{dx}\big|_{x=x_0}
dxdf(x)
x=x0。
這裏 f ( x 0 ) f(x_0) f(x0)是 f ( x ) f(x) f(x)在 x 0 x_0 x0有定義了。從極限的定義過來,現在涉及 lim x → x 0 f ( x ) = A = f ( x 0 ) \lim \limits_{x\rightarrow x_0}f(x)=A=f(x_0) x→x0limf(x)=A=f(x0),定義域不再是 x 0 x_0 x0的去心鄰域,而是 x 0 x_0 x0的鄰域。
我們來看函數連續的定義。
定義:設函數 y = f ( x ) y=f(x) y=f(x)在點 x 0 x_0 x0的某一鄰域內有定義,如果 lim x → x 0 f ( x ) = f ( x 0 ) \lim \limits_{x\rightarrow x_0}f(x)=f(x_0) x→x0limf(x)=f(x0),那麽就稱函數 f ( x ) f(x) f(x)在點 x 0 x_0 x0連續。
這個定義如果用 ε − δ \varepsilon-\delta ε−δ表達:
lim x → x 0 f ( x ) = f ( x 0 ) ⇔ ∀ ε > 0 \lim\limits_{x\rightarrow x_0} f(x)=f(x_0)\Leftrightarrow \forall \varepsilon>0 x→x0limf(x)=f(x0)⇔∀ε>0, ∃ δ > 0 \exists \delta>0 ∃δ>0,當 0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0<∣x−x0∣<δ, ∣ f ( x ) − f ( x 0 ) ∣ < ε |f(x)-f(x_0)|<\varepsilon ∣f(x)−f(x0)∣<ε。
這個 ε − δ \varepsilon-\delta ε−δ表達為什麼仍然是去心鄰域 x ∈ U ˚ ( x 0 , δ ) x \in \mathring{U}(x_0,\delta) x∈U˚(x0,δ)?因為求某點的極限,就是點的去心鄰域求極限。
鄰域體現在 f ( x 0 ) f(x_0) f(x0)這個表達式, f ( x ) f(x) f(x)在 x = x 0 x=x_0 x=x0點有定義。求極限的定義中, ∣ f ( x ) − A ∣ < ε |f(x)-A|<\varepsilon ∣f(x)−A∣<ε。
既然函數『判斷是否連續』這個運算,那就有函數和、差、積、商、反函數、複合函數『判斷是否連續』的任務;同理,求導還有函數和、差、積、商、反函數、複合函數的求導。本文僅聚焦與複合函數的求導。
我們看近一點 Δ x \Delta x Δx。 Δ x = x − x 0 \Delta x=x-x_0 Δx=x−x0,相當於 Δ ( x ) = x − x 0 \Delta(x)=x-x_0 Δ(x)=x−x0,這是一個函數, Δ \Delta Δ是函數標識,是一條在 y y y軸下移 x 0 x_0 x0的直線。當 x → x 0 x\rightarrow x_0 x→x0, lim x → x 0 Δ x = lim x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}\Delta x=\lim \limits_{x\rightarrow x_0}(x-x_0)=0 x→x0limΔx=x→x0lim(x−x0)=0,用 ε − δ \varepsilon-\delta ε−δ表達, ∀ ϵ > 0 \forall \epsilon>0 ∀ϵ>0,令 δ = ε \delta=\varepsilon δ=ε,使得 0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0<∣x−x0∣<δ, ∣ x − x 0 ∣ < ϵ |x-x_0|<\epsilon ∣x−x0∣<ϵ。
換句話說,當 x → x 0 x\rightarrow x_0 x→x0, Δ x \Delta x Δx是一個無窮小函數,且 Δ x ≠ 0 \Delta x\ne 0 Δx=0,因為一旦求極限,by definition,定義在 x 0 x_0 x0的去心鄰域,而不是鄰域,所以 Δ x ≠ 0 \Delta x\ne 0 Δx=0。如果 x → x 0 − x\rightarrow {x_0}^- x→x0−,即 x x x從 x 0 x_0 x0的左側趨向於 x 0 x_0 x0,就是座標軸上,從負向往正向趨向於 x 0 x_0 x0,或者說從比 x 0 x_0 x0小的數趨向於 x 0 x_0 x0,或者說按地圖默認方向上北下南左西右東,從西側向東趨向於 x 0 x_0 x0,那麽, Δ x < 0 \Delta x<0 Δx<0。反之, x → x 0 + x\rightarrow {x_0}^+ x→x0+, Δ x > 0 \Delta x>0 Δx>0。在微分中, Δ x \Delta x Δx又寫成 d x \mathrm{d}x dx,我們一般直覺地想到函數求面積,割成無數個密密緊緊的小的矩形, d x \mathrm{d}x dx是 X X X軸上的小小的短線。這樣神秘化 d x \mathrm{d}x dx了,混淆了微分和積分,積分中 Δ x \Delta x Δx是在乘數的位置,是求函數面積。是求極限中的 x 0 x_0 x0不停地移動。如果積分區間的第一個數是 x 0 x_0 x0,第一個 d x \mathrm{d}x dx區間是 ( x 0 , x 1 ] (x_0,x_1] (x0,x1], d x = x 1 − x 0 \mathrm{d}x=x_1-x_0 dx=x1−x0,第2個積分區間是 ( x 1 , x 2 ] (x_1,x_2] (x1,x2], d x = x 2 − x 1 \mathrm{d}x=x_2-x_1 dx=x2−x1,……。求導中 d x = Δ x = x − x 0 \mathrm{d}x=\Delta x=x-x_0 dx=Δx=x−x0,放在分母,當 x → x 0 x\rightarrow x_0 x→x0,是無窮小,但 d x = Δ x ≠ 0 \mathrm{d}x=\Delta x\ne 0 dx=Δx=0,所以其寫在分母的位置,我們沒有條件反射似的趕緊註明『分母不為零』。我們可不能簡單地將 d x \mathrm{d}x dx中的 d \mathrm{d} d視為普通字母 d d d,也是一個函數的標識,就像 f ( x ) f(x) f(x)的 f f f。數學公式中所有代表變量的字母甚至代表函數的字母都是斜體,可是 d x \mathrm{d}x dx中的 d \mathrm{d} d是正體。 d x \mathrm{d}x dx我們要視為 d ( x ) = x − x 0 \mathrm{d}(x)=x-x_0 d(x)=x−x0,當 x → x 0 x\rightarrow x_0 x→x0,一個無窮小, lim x → x 0 d x = lim x → x 0 Δ x = lim x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}\mathrm{d}x=\lim \limits_{x\rightarrow x_0}\Delta x=\lim \limits_{x\rightarrow x_0}(x-x_0)=0 x→x0limdx=x→x0limΔx=x→x0lim(x−x0)=0。
我們來看 Δ y \Delta y Δy。 Δ y = f ( x ) − f ( x 0 ) = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x)-f(x_0)=f(x_0+\Delta x)-f(x_0) Δy=f(x)−f(x0)=f(x0+Δx)−f(x0),當 f ( x ) f(x) f(x)在 x 0 x_0 x0導數存在時, lim x → x 0 Δ y Δ x = f ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{\Delta y}{\Delta x}=f'(x_0) x→x0limΔxΔy=f′(x0),如果 f ′ ( x 0 ) = 0 f'(x_0)=0 f′(x0)=0,則, x → x 0 x\rightarrow x_0 x→x0時, Δ y \Delta y Δy是 Δ x \Delta x Δx的高階無窮小, Δ y = o ( Δ x ) \Delta y=o(\Delta x) Δy=o(Δx);如果 f ′ ( x 0 ) ≠ 0 f'(x_0)\ne 0 f′(x0)=0, f ′ ( x 0 ) f'(x_0) f′(x0)是個非零的常數,那麽 Δ y \Delta y Δy是 Δ x \Delta x Δx的同階無窮小。總之,如果 x 0 x_0 x0點導數存在,當 x → x 0 x\rightarrow x_0 x→x0, Δ y \Delta y Δy必是無窮小,如果 Δ y = f ( x ) − f ( x 0 ) \Delta y=f(x)-f(x_0) Δy=f(x)−f(x0)這麽定義 Δ y \Delta y Δy是自變量為 x x x的無窮小,如果 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)−f(x0)這麽定義, Δ y \Delta y Δy的自變量是 Δ x \Delta x Δx,還是個複合函數(即嵌套函數),因為 Δ x = x − x 0 \Delta x=x-x_0 Δx=x−x0。當 x → x 0 x\rightarrow x_0 x→x0, Δ y \Delta y Δy是無窮小, lim x → x 0 Δ y = lim x → x 0 [ f ( x ) − f ( x 0 ) ] = 0 ⇒ lim x → x 0 f ( x ) = f ( x 0 ) \lim \limits_{x \rightarrow x_0}\Delta y=\lim \limits_{x \rightarrow x_0}[f(x)-f(x_0)]=0 \Rightarrow \lim \limits_{x \rightarrow x_0}f(x)=f(x_0) x→x0limΔy=x→x0lim[f(x)−f(x0)]=0⇒x→x0limf(x)=f(x0),即 f ( x ) f(x) f(x)在 x 0 x_0 x0連續。所以,函數在某點可導必連續。
可以看出來,求極限是在某點的去心鄰域求 f ( x ) f(x) f(x)極限,求導是連續函數在某點的去心鄰域求導。能不能直接說求導是某點的鄰域求導?可以的,因為求導這一運算包括了『判斷連續』和『求極限』兩個操作。能不能說求導是在某點的鄰域 Δ y Δ x \frac{\Delta y}{\Delta x} ΔxΔy求極限呢?不能,求極限只能在去心鄰域求極限。
求導必某點求導,是函數在此點有定義,且在此點去心鄰域 Δ y Δ x \frac{\Delta y}{\Delta x} ΔxΔy求極限。所以導函數怎麼理解?我們背誦的求導公式,比如, ( sin x ) ′ = cos x (\sin x)'=\cos x (sinx)′=cosx,真正的含義是 ( sin x ) ′ ∣ x = x 0 = cos x 0 (\sin x)'|_{x=x_0}=\cos x_0 (sinx)′∣x=x0=cosx0。又因為 ( sin x ) ′ ∣ x = x 1 = cos x 1 (\sin x)'|_{x=x_1}=\cos x_1 (sinx)′∣x=x1=cosx1,所以,這裏有一個pattern, ( sin x ) ′ ∣ x = x 0 = cos x ∣ x = x 0 (\sin x)'|_{x=x_0}=\cos x|_{x=x_0} (sinx)′∣x=x0=cosx∣x=x0,所以稱 sin x \sin x sinx的導函數是 cos x \cos x cosx,記作 ( sin x ) ′ = cos x (\sin x)'=\cos x (sinx)′=cosx。
所以我們可以這樣理解導數和導函數:
『導數』:在函數 y = f ( x ) y=f(x) y=f(x)的定義域 D f D_f Df上取任意一點 x 0 x_0 x0,當 x x x在 x 0 x_0 x0的去心鄰域變化,得到增量 Δ x \Delta x Δx,相應地,因變量取得增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)−f(x0)。如果 Δ y \Delta y Δy與 Δ x \Delta x Δx之比當 Δ x → 0 \Delta x\rightarrow 0 Δx→0極限存在,那麽稱函數 y = f ( x ) y=f(x) y=f(x)在 x 0 x_0 x0處可導,並稱這個極限為 f ( x ) f(x) f(x)在點 x 0 x_0 x0的導數,記為 d f ( x ) d x ∣ x = x 0 \frac{d{f(x)}}{dx}\big|_{x=x_0} dxdf(x) x=x0。
d f ( x ) d x ∣ x = x 0 = lim x → x 0 Δ y Δ x = lim x → x 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x = g ( x 0 ) \frac{d{f(x)}}{dx}\big|_{x=x_0}=\lim \limits_{x\rightarrow x_0}\frac{\Delta y}{\Delta x}=\lim \limits_{x\rightarrow x_0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=g(x_0) dxdf(x) x=x0=x→x0limΔxΔy=x→x0limΔxf(x0+Δx)−f(x0)=g(x0)
『導函數』:由於 x 0 x_0 x0是定義域 D f D_f Df上任意點, g ( x 0 ) = g ( x ) ∣ x = x 0 g(x_0)=g(x)|_{x=x_0} g(x0)=g(x)∣x=x0,稱 g ( x ) g(x) g(x)是 f ( x ) f(x) f(x)的導函數,記作 f ′ ( x ) = g ( x ) = y ′ f'(x)=g(x)=y' f′(x)=g(x)=y′。 f ( x ) f(x) f(x)在點 x 0 x_0 x0的導數為 g ( x 0 ) = g ( x ) ∣ x = x 0 = f ′ ( x ) ∣ x = x 0 = f ′ ( x 0 ) g(x_0)=g(x)|_{x=x_0}=f'(x)|_{x=x_0}=f'(x_0) g(x0)=g(x)∣x=x0=f′(x)∣x=x0=f′(x0)。
以下證明鏈式法則。
鏈式法則 如果
u
=
g
(
x
)
u=g(x)
u=g(x) 在點
x
0
x_0
x0可導,而
y
=
f
(
u
)
y=f(u)
y=f(u)在點
u
0
=
g
(
x
0
)
u_0=g(x_0)
u0=g(x0)可導,則複合函數
u
=
f
[
g
(
x
)
]
u=f[g(x)]
u=f[g(x)]在點
x
0
x_0
x0可導,且導數為
d
y
d
x
∣
x
=
x
0
=
f
′
(
g
(
x
0
)
)
⋅
g
′
(
x
0
)
.
\frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(g(x_0))\cdot g'(x_0).
dxdy
x=x0=f′(g(x0))⋅g′(x0).
證:按定義, d y d x ∣ x = x 0 = lim x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] x − x 0 \displaystyle \frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=\lim \limits_{x\rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0} dxdy x=x0=x→x0limx−x0f[g(x)]−f[g(x0)]。
嵌套函數求極限,代換,
u
=
g
(
x
)
u=g(x)
u=g(x)。
lim
x
→
x
0
f
[
g
(
x
)
]
−
f
[
g
(
x
0
)
]
x
−
x
0
=
lim
x
→
x
0
(
f
[
g
(
x
)
]
−
f
[
g
(
x
0
)
]
u
−
u
0
u
−
u
0
x
−
x
0
)
(公式1)
\lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0}=\lim \limits_{x \rightarrow x_0}\left (\frac{f[g(x)]-f[g(x_0)]}{u-u_0}\frac{u-u_0}{x-x_0}\right ) \text{(公式1)}
x→x0limx−x0f[g(x)]−f[g(x0)]=x→x0lim(u−u0f[g(x)]−f[g(x0)]x−x0u−u0)(公式1)
lim x → x 0 u − u 0 x − x 0 \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0} x→x0limx−x0u−u0極限存在, lim x → x 0 u − u 0 x − x 0 = g ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0}=g'(x_0) x→x0limx−x0u−u0=g′(x0),我們來證明 lim x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 \lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{u-u_0} x→x0limu−u0f[g(x)]−f[g(x0)]極限存在。
因為 lim u → u 0 f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 = f ′ ( u 0 ) \lim \limits_{u \rightarrow u_0}\frac{f[g(x)]-f[g(x_0)]}{u-u_0}=f'(u_0) u→u0limu−u0f[g(x)]−f[g(x0)]=f′(u0),用 ε − δ \varepsilon-\delta ε−δ表示, ∀ ε 1 > 0 \forall \varepsilon_1>0 ∀ε1>0, ∃ δ 1 > 0 \exists \delta_1>0 ∃δ1>0,使得一切 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<∣u−u0∣<δ1, ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 ∣u−u0f(u)−f(u0)−f′(u0)∣<ε1。
思路:現在 x → x 0 x\rightarrow x_0 x→x0,如果我們能找到 x 0 x_0 x0的某個去心鄰域,使得 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<∣u−u0∣<δ1,則 x 0 x_0 x0的這個去心鄰域內, ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 ∣u−u0f(u)−f(u0)−f′(u0)∣<ε1。
因為 lim x → x 0 u − u 0 x − x 0 \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0} x→x0limx−x0u−u0極限存在, lim x → x 0 u − u 0 x − x 0 = g ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0}=g'(x_0) x→x0limx−x0u−u0=g′(x0),所以 lim x → x 0 ( u − u 0 ) = lim x → x 0 [ ( u − u 0 ) x − x 0 ( x − x 0 ) ] = lim x → x 0 ( u − u 0 ) x − x 0 lim x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}(u-u_0)=\lim \limits_{x\rightarrow x_0}[\frac{(u-u_0)}{x-x_0}(x-x_0)]=\lim \limits_{x\rightarrow x_0}\frac{(u-u_0)}{x-x_0}\lim \limits_{x\rightarrow x_0}(x-x_0)=0 x→x0lim(u−u0)=x→x0lim[x−x0(u−u0)(x−x0)]=x→x0limx−x0(u−u0)x→x0lim(x−x0)=0。
lim x → x 0 ( u − u 0 ) = 0 \lim \limits_{x\rightarrow x_0}(u-u_0)=0 x→x0lim(u−u0)=0,用 ε − δ \varepsilon-\delta ε−δ表示,令 ε 2 = δ 1 \varepsilon_2=\delta_1 ε2=δ1, ∃ δ 2 > 0 \exists \delta_2>0 ∃δ2>0,使得 0 < ∣ x − x 0 ∣ < δ 2 0<|x-x_0|<\delta_2 0<∣x−x0∣<δ2, ∣ u − u 0 ∣ < ε 2 = δ 1 |u-u_0|<\varepsilon_2=\delta_1 ∣u−u0∣<ε2=δ1。
又因為 ∣ x − x 0 ∣ > 0 |x-x_0|>0 ∣x−x0∣>0,如果此去心鄰域內一切 u = u 0 u= u_0 u=u0,那 u = g ( x ) = g ( x 0 ) = c 0 u=g(x)=g(x_0)=c_0 u=g(x)=g(x0)=c0是個常數函數, c 0 c_0 c0是常數,所以, f [ g ( x ) ] = f ( c 0 ) ] f[g(x)]=f(c_0)] f[g(x)]=f(c0)]也是常數函數,常數函數不含變量,不是複合函數。就算 g ( x ) g(x) g(x)是一個分段函數,在點 x 0 x_0 x0的去心鄰域是常數,那麽,不會 g ( x ) g(x) g(x)的整個定義域 D g D_g Dg, g ( x ) g(x) g(x)是常數,我們取 x 0 x_0 x0位於分段函數非常數的子域。而分段函數為常數的子域, f ( g ( x 0 ) ) = c 0 f(g(x_0))=c_0 f(g(x0))=c0,導數為 0 0 0, g ′ ( x 0 ) = 0 g'(x_0)=0 g′(x0)=0, f ′ ( g ( x 0 ) ) = 0 f'(g(x_0))=0 f′(g(x0))=0, f ′ ( g ( x 0 ) ) = f ′ ( g ( x 0 ) ) ⋅ g ′ ( x 0 ) = 0 f'(g(x_0))=f'(g(x_0))\cdot g'(x_0)=0 f′(g(x0))=f′(g(x0))⋅g′(x0)=0,trivial。
g ( x ) g(x) g(x)在定義域某子域非常數函數, x 0 x_0 x0位於該子域,一切 x x x在 x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)不可能一切 u = u 0 u= u_0 u=u0。
如果一切 x x x在 x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)時,一切 u ≠ u 0 u\ne u_0 u=u0,那我們找到了 x 0 x_0 x0的這個去心鄰域,使得 ∀ ε 1 > 0 \forall \varepsilon_1>0 ∀ε1>0, ∃ δ 2 > 0 \exists \delta_2>0 ∃δ2>0,當 0 < ∣ x − x 0 ∣ < δ 2 0<|x-x_0|<\delta_2 0<∣x−x0∣<δ2時, 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<∣u−u0∣<δ1, ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 ∣u−u0f(u)−f(u0)−f′(u0)∣<ε1。
如果,一切 x x x在 x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)時,存在一些點 x 1 , x 2 , . . . , x i , . . . ( i ∈ N + , x i ≠ x 0 , x 1 < x 2 < . . . < x i < . . . ) x_1,x_2,...,x_i,...(i\in\mathrm{N}_+,x_i\ne x_0,x_1<x_2<...<x_i<...) x1,x2,...,xi,...(i∈N+,xi=x0,x1<x2<...<xi<...),使得 u ( x i ) = u 0 u(x_i)=u_0 u(xi)=u0,那麽,取第一個最靠近 x 0 x_0 x0的點 x j x_j xj,令 ∣ x j − x 0 ∣ = m i n { ∣ x 1 − x 0 ∣ , ∣ x 2 − x 0 ∣ , . . . , ∣ x i − x 0 ∣ , . . . } |x_j-x_0|=min\{|x_1-x_0|,|x_2-x_0|,...,|x_i-x_0|,...\} ∣xj−x0∣=min{∣x1−x0∣,∣x2−x0∣,...,∣xi−x0∣,...},令 δ 3 = ∣ x 0 − x j ∣ \delta_3=|x_0-x_j| δ3=∣x0−xj∣,當 x x x在這個去心鄰域 U ˚ ( x 0 , δ 3 ) \mathring U(x_0,\delta_3) U˚(x0,δ3), ∣ u − u 0 ∣ > 0 |u-u_0|>0 ∣u−u0∣>0。這樣我們找到了這個 x 0 x_0 x0去心鄰域,對於 ∀ ε 1 > 0 \forall \varepsilon_1>0 ∀ε1>0,當一切 x ∈ U ˚ ( x 0 , δ 3 ) x\in\mathring U(x_0,\delta_3) x∈U˚(x0,δ3), 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<∣u−u0∣<δ1, ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 ∣u−u0f(u)−f(u0)−f′(u0)∣<ε1。
故, lim x → x 0 f ( u ) − f ( u 0 ) u − u 0 \lim \limits_{x\rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0} x→x0limu−u0f(u)−f(u0)極限存在, lim x → x 0 f ( u ) − f ( u 0 ) u − u 0 = f ′ ( u 0 ) \lim \limits_{x\rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0}=f'(u_0) x→x0limu−u0f(u)−f(u0)=f′(u0)。
函數積的極限=極限的積,公式1為:
lim x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] x − x 0 = lim x → x 0 ( f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 u − u 0 x − x 0 ) = lim x → x 0 f ( u ) − f ( u 0 ) u − u 0 lim x → x 0 u − u 0 x − x 0 = f ′ ( u 0 ) u ′ ( x 0 ) = f ′ ( g ( x 0 ) ) ⋅ g ′ ( x 0 ) \lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0}=\lim \limits_{x \rightarrow x_0}\left (\frac{f[g(x)]-f[g(x_0)]}{u-u_0}\frac{u-u_0}{x-x_0}\right ) =\lim \limits_{x \rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0}\lim \limits_{x \rightarrow x_0}\frac{u-u_0}{x-x_0} =f'(u_0)u'(x_0) =f'(g(x_0))\cdot g'(x_0) x→x0limx−x0f[g(x)]−f[g(x0)]=x→x0lim(u−u0f[g(x)]−f[g(x0)]x−x0u−u0)=x→x0limu−u0f(u)−f(u0)x→x0limx−x0u−u0=f′(u0)u′(x0)=f′(g(x0))⋅g′(x0)
Q.E.D.
附錄 不同《高等數學》課本對鏈式法則的定義
《高等數學(第三版)上冊》(1995)的定義如下。
鏈式法則 如果
u
=
ϕ
(
x
)
u=\phi (x)
u=ϕ(x) 在點
x
0
x_0
x0可導,而
y
=
f
(
u
)
y=f(u)
y=f(u)在點
u
0
=
ϕ
(
x
0
)
u_0=\phi(x_0)
u0=ϕ(x0)可導,則複合函數
u
=
f
[
ϕ
(
x
)
]
u=f[\phi(x)]
u=f[ϕ(x)]在點
x
0
x_0
x0可導,且導數為
d
y
d
x
∣
x
=
x
0
=
f
′
(
ϕ
(
x
0
)
)
⋅
ϕ
′
(
x
0
)
\frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(\phi(x_0))\cdot\phi'(x_0)
dxdy
x=x0=f′(ϕ(x0))⋅ϕ′(x0)
《高等數學(第七版)上冊》(2015)的定義如下。
鏈式法則 如果
u
=
g
(
x
)
u=g(x)
u=g(x) 在點
x
x
x可導,而
y
=
f
(
u
)
y=f(u)
y=f(u)在點
u
=
g
(
x
)
u=g(x)
u=g(x)可導,則複合函數
u
=
f
[
g
(
x
)
]
u=f[g(x)]
u=f[g(x)]在點
x
x
x可導,且導數為
d
y
d
x
=
f
′
(
ϕ
(
x
)
)
⋅
ϕ
′
(
x
)
或
d
y
d
x
=
d
y
d
x
⋅
d
u
d
x
\frac{\mathrm{d}y}{\mathrm{d}x}=f'(\phi(x))\cdot\phi'(x) \text{或}\frac{dy}{dx}=\frac{dy}{dx}\cdot \frac{du}{dx}
dxdy=f′(ϕ(x))⋅ϕ′(x)或dxdy=dxdy⋅dxdu