鏈式法則的證明

說明:本文最後一部分是鏈式法則的證明,可以直接讀最後一部分。我的狀態是重讀高數,所以追溯術語定義。

無窮小的和差積是無窮小,但是兩個無窮小的商會出現不同的情況。例如,當 x → 0 x\rightarrow 0 x0時, 3 x 3x 3x x 2 x^2 x2 sin ⁡ x \sin{x} sinx都是無窮小,而 lim ⁡ x → 0 x 2 3 x = 0 \lim \limits_{x\rightarrow 0}\frac{x^2}{3x}=0 x0lim3xx2=0 lim ⁡ x → 0 3 x x 2 = ∞ \lim \limits_{x\rightarrow 0}\frac{3x}{x^2}=\infty x0limx23x= lim ⁡ x → 0 sin ⁡ x 3 x = 1 3 \lim \limits_{x\rightarrow 0}\frac{\sin{x}}{3x}=\frac{1}{3} x0lim3xsinx=31(註: lim ⁡ x → 0 sin ⁡ x x = 1 \lim \limits_{x\rightarrow 0}\frac{\sin{x}}{x}=1 x0limxsinx=1,本文不作證明)。

定義:
如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α = 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=0 (or)xxx0limαβ=0,那麽就說 β \beta β是比 α \alpha α高階的無窮小,記作 β = o ( α ) \beta=o(\alpha) β=o(α)
如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α = ∞ \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\infty (or)xxx0limαβ=,那麽就說 β \beta β是比 α \alpha α低階的無窮小。
如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α = c ≠ 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=c\ne 0 (or)xxx0limαβ=c=0,那麽就說 β \beta β α \alpha α是同階的無窮小。
如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α k = c ≠ 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha^k}=c\ne 0 (or)xxx0limαkβ=c=0 k > 0 k>0 k>0,那麽就說 β \beta β是關於 α \alpha α k k k階的無窮小。
如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α = 1 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=1 (or)xxx0limαβ=1,那麽就說 β \beta β α \alpha α是等價無窮小,記作 α ∼ β \alpha\sim \beta αβ

等價無窮小有兩個定理。

定理1 β \beta β α \alpha α是等價無窮小的充分必要條件為 β = α + o ( α ) \beta=\alpha+o(\alpha) β=α+o(α)
證: ⇒ ] \Rightarrow ] ]必要性。 lim ⁡ x → x 0 ( o r ) x → ∞ β α = 1 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=1 (or)xxx0limαβ=1 lim ⁡ x → x 0 ( o r ) x → ∞ β − α α = 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta-\alpha}{\alpha}=0 (or)xxx0limαβα=0 β − α = o ( α ) \beta-\alpha=o(\alpha) βα=o(α) β = α + o ( α ) \beta=\alpha+o(\alpha) β=α+o(α)
⇐ ] \Leftarrow ] ]充分性。 β − α = o ( α ) \beta-\alpha=o(\alpha) βα=o(α) lim ⁡ x → x 0 ( o r ) x → ∞ β α = lim ⁡ x → x 0 ( o r ) x → ∞ α + o ( α ) α = lim ⁡ x → x 0 ( o r ) x → ∞ ( 1 + o ( α ) α ) = 1 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\alpha+o(\alpha)}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}(1+\frac{o(\alpha)}{\alpha})=1 (or)xxx0limαβ=(or)xxx0limαα+o(α)=(or)xxx0lim(1+αo(α))=1

定理2 設 α ∼ α ˜ \alpha\sim \~\alpha αα˜ β ∼ β ˜ \beta\sim\~\beta ββ˜,且 lim ⁡ x → x 0 ( o r ) x → ∞ β ˜ α ˜ \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha} (or)xxx0limα˜β˜存在, lim ⁡ x → x 0 ( o r ) x → ∞ β α = lim ⁡ x → x 0 ( o r ) x → ∞ β ˜ α ˜ \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha} (or)xxx0limαβ=(or)xxx0limα˜β˜
證: lim ⁡ x → x 0 ( o r ) x → ∞ β ˜ α ˜ = lim ⁡ x → x 0 ( o r ) x → ∞ β ˜ β β α α α ˜ = lim ⁡ x → x 0 ( o r ) x → ∞ β ˜ β lim ⁡ x → x 0 ( o r ) x → ∞ β α lim ⁡ x → x 0 ( o r ) x → ∞ α α ˜ \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\~\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\beta}\frac{\beta}{\alpha}\frac{\alpha}{\~\alpha}=\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\~\beta}{\beta}\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}\lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\alpha}{\~\alpha} (or)xxx0limα˜β˜=(or)xxx0limββ˜αβα˜α=(or)xxx0limββ˜(or)xxx0limαβ(or)xxx0limα˜α

我們來看近一點無窮小 α \alpha α

1)無窮小有無窮小函數或無窮小數列,這裏 α \alpha α是無窮小函數。雖然看上去是單個字母,但是我們要清楚這個字母表示函數,我們要在心裏翻譯成有自變量的函數,比如自變量用 x x x表示,即 α = α ( x ) \alpha=\alpha(x) α=α(x)。我們說 α ( x ) \alpha(x) α(x)是無窮小具體什麼意思呢?當 x → x 0 x \rightarrow x_0 xx0 α ( x ) → 0 \alpha(x) \rightarrow 0 α(x)0,即 lim ⁡ x → x 0 α ( x ) = 0 \lim \limits_{x \rightarrow x_0}\alpha(x)=0 xx0limα(x)=0

2) β ∼ α \beta \sim \alpha βα,則 β = α + o ( α ) \beta= \alpha+o(\alpha) β=α+o(α),特別地, α ∼ α + o ( α ) \alpha \sim \alpha+o(\alpha) αα+o(α)。例如,當 x → 0 x \rightarrow 0 x0,例如 3 x ∼ 3 x + x 2 3x \sim 3x+x^2 3x3x+x2,當 x → 0 x\rightarrow 0 x0

3)如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α = 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha}=0 (or)xxx0limαβ=0,那麽就說 β \beta β是比 α \alpha α高階的無窮小,記作 β = o ( α ) \beta=o(\alpha) β=o(α)

o ( α ) o(\alpha) o(α)直覺上是什麼意思呢?

By definition,無窮小 = = =函數求某一點極限、極限為 0 0 0。所以當我們談無窮小,我們必然指的是求極限,前提是自變量同一變化條件,即自變量 x → x 0 x\rightarrow x_0 xx0,或者自變量 x → ∞ x\rightarrow \infty x,但本段敘述,我們以 x → x 0 x\rightarrow x_0 xx0為例。如果我們用泰勒展開式來理解,函數 f ( x ) f(x) f(x) x 0 x_0 x0多階導數存在,那麽函數就可以展開成多項式,當 x → x 0 x\rightarrow x_0 xx0,即一切 x ∈ U ˚ ( x 0 ) x\in \r{U}(x_0) xU˚(x0) f ( x ) = f ( x 0 ) + f ′ ( x 0 ) ( x − x 0 ) + f ′ ′ ( x 0 ) 2 ! ( x − x 0 ) + . . . + f ( n ) ( x 0 ) n ! ( x − x 0 ) n + . . . f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+... f(x)=f(x0)+f(x0)(xx0)+2!f′′(x0)(xx0)+...+n!f(n)(x0)(xx0)n+...。這裏的函數是任何函數,比如三角函數,或者看著很古怪很複雜的函數。這個事實很重要,因為對人手算和計算機CPU指令計算來說,只能加減乘除,我們不會算三角函數,CPU也不會,真正的計算是使用泰勒展開式,使函數變成多項式,再做人或CPU的計算。
所以我們想想看,兩個無窮小的比較,本質是每個函數的第一個 x i x^i xi的比較,誰的冪 i i i更大,誰收斂得更快,誰就是更高階的無窮小。

如果 lim ⁡ x → x 0 ( o r ) x → ∞ β α k = c ≠ 0 \lim\limits_{x\rightarrow x_0 \atop \text( or ) x\rightarrow \infty}\frac{\beta}{\alpha^k}=c\ne 0 (or)xxx0limαkβ=c=0 k > 0 k>0 k>0,那麽說 β \beta β是關於 α \alpha α k k k階的無窮小。假設我們以 y = x y=x y=x為例, α = α ( x ) = x \alpha=\alpha(x)=x α=α(x)=x x → x 0 x\rightarrow x_0 xx0,那麽, β \beta β α \alpha α k k k階無窮小指的是, β = β ( x ) \beta=\beta(x) β=β(x),在 x 0 x_0 x0的鄰域泰勒展開的話,最小冪次項 x k x^k xk。當然,如果 α = α ( x ) = x 2 \alpha=\alpha(x)=x^2 α=α(x)=x2,那麽 β = β ( x ) \beta=\beta(x) β=β(x)的泰勒展開式中最小冪次項 x 2 k x^{2k} x2k

那如果 α = α ( x ) = x 2 \alpha=\alpha(x)=x^2 α=α(x)=x2 o ( α ) o(\alpha) o(α)直覺上是 x 3 x^3 x3 x 4 x^4 x4,或者泰勒展開式中最小冪次項是 x 3 x^3 x3 x 4 x^4 x4這樣的函數。 α = α ( x ) = x 7 \alpha=\alpha(x)=x^7 α=α(x)=x7 o ( α ) o(\alpha) o(α)直覺上 x 8 x^8 x8起。換句話說,當 x → 0 x\rightarrow 0 x0 β \beta β o ( α ) o(\alpha) o(α),到底還是要用 x x x表示的函數, x x x的冪次比 α ( x ) \alpha(x) α(x)更高。這裏的討論, x → 0 x\rightarrow 0 x0即泰勒展開式 ( x − x 0 ) → 0 (x-x_0) \rightarrow 0 (xx0)0,即 x → x 0 x\rightarrow x_0 xx0

我們來證明複合函數求導法則即鏈式法則(chain rule)。定義如下(參考附錄)——

鏈式法則 如果 u = g ( x ) u=g(x) u=g(x) 在點 x 0 x_0 x0可導,而 y = f ( u ) y=f(u) y=f(u)在點 u 0 = g ( x 0 ) u_0=g(x_0) u0=g(x0)可導,則複合函數 u = f [ g ( x ) ] u=f[g(x)] u=f[g(x)]在點 x 0 x_0 x0可導,且導數為
d y d x ∣ x = x 0 = f ′ ( ϕ ( x 0 ) ) ⋅ ϕ ′ ( x 0 ) \frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(\phi(x_0))\cdot\phi'(x_0) dxdy x=x0=f(ϕ(x0))ϕ(x0)

什麼是『可導』?

x → x 0 x \rightarrow x_0 xx0,令 Δ x = x − x 0 \Delta x=x-x_0 Δx=xx0 Δ y = f ( x ) − f ( x 0 ) = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x)-f(x_0)=f(x_0+\Delta x)-f(x_0) Δy=f(x)f(x0)=f(x0+Δx)f(x0)

定義:設函數 y = f ( x ) y=f(x) y=f(x)在點的某個鄰域內有定義,當自變量 x x x x 0 x_0 x0處得到增量 Δ x \Delta x Δx(點 x 0 + Δ x x_0+\Delta x x0+Δx仍在該鄰域內)時,相應地,因變量取得增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)f(x0)。如果 Δ y \Delta y Δy Δ x \Delta x Δx之比當 Δ x → 0 \Delta x\rightarrow 0 Δx0極限存在,那麽稱函數 y = f ( x ) y=f(x) y=f(x) x 0 x_0 x0可導,並稱這個極限為導數,記為 f ′ ( x 0 ) f'(x_0) f(x0),即 f ′ ( x 0 ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f'(x_0)=\lim \limits_{\Delta x\rightarrow 0}\frac{\Delta y}{\Delta x}=\lim \limits_{\Delta x\rightarrow 0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x} f(x0)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)
也可記作 y ′ ∣ x = x 0 y'|_{x=x_0} yx=x0 d f ( x ) d x ∣ x = x 0 \frac{d{f(x)}}{dx}\big|_{x=x_0} dxdf(x) x=x0

這裏 f ( x 0 ) f(x_0) f(x0) f ( x ) f(x) f(x) x 0 x_0 x0有定義了。從極限的定義過來,現在涉及 lim ⁡ x → x 0 f ( x ) = A = f ( x 0 ) \lim \limits_{x\rightarrow x_0}f(x)=A=f(x_0) xx0limf(x)=A=f(x0),定義域不再是 x 0 x_0 x0的去心鄰域,而是 x 0 x_0 x0的鄰域。

我們來看函數連續的定義。

定義:設函數 y = f ( x ) y=f(x) y=f(x)在點 x 0 x_0 x0的某一鄰域內有定義,如果 lim ⁡ x → x 0 f ( x ) = f ( x 0 ) \lim \limits_{x\rightarrow x_0}f(x)=f(x_0) xx0limf(x)=f(x0),那麽就稱函數 f ( x ) f(x) f(x)在點 x 0 x_0 x0連續。

這個定義如果用 ε − δ \varepsilon-\delta εδ表達:

lim ⁡ x → x 0 f ( x ) = f ( x 0 ) ⇔ ∀ ε > 0 \lim\limits_{x\rightarrow x_0} f(x)=f(x_0)\Leftrightarrow \forall \varepsilon>0 xx0limf(x)=f(x0)ε>0 ∃ δ > 0 \exists \delta>0 δ>0,當 0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0<xx0<δ ∣ f ( x ) − f ( x 0 ) ∣ < ε |f(x)-f(x_0)|<\varepsilon f(x)f(x0)<ε

這個 ε − δ \varepsilon-\delta εδ表達為什麼仍然是去心鄰域 x ∈ U ˚ ( x 0 , δ ) x \in \mathring{U}(x_0,\delta) xU˚(x0,δ)?因為求某點的極限,就是點的去心鄰域求極限。

鄰域體現在 f ( x 0 ) f(x_0) f(x0)這個表達式, f ( x ) f(x) f(x) x = x 0 x=x_0 x=x0點有定義。求極限的定義中, ∣ f ( x ) − A ∣ < ε |f(x)-A|<\varepsilon f(x)A<ε

既然函數『判斷是否連續』這個運算,那就有函數和、差、積、商、反函數、複合函數『判斷是否連續』的任務;同理,求導還有函數和、差、積、商、反函數、複合函數的求導。本文僅聚焦與複合函數的求導。

我們看近一點 Δ x \Delta x Δx Δ x = x − x 0 \Delta x=x-x_0 Δx=xx0,相當於 Δ ( x ) = x − x 0 \Delta(x)=x-x_0 Δ(x)=xx0,這是一個函數, Δ \Delta Δ是函數標識,是一條在 y y y軸下移 x 0 x_0 x0的直線。當 x → x 0 x\rightarrow x_0 xx0 lim ⁡ x → x 0 Δ x = lim ⁡ x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}\Delta x=\lim \limits_{x\rightarrow x_0}(x-x_0)=0 xx0limΔx=xx0lim(xx0)=0,用 ε − δ \varepsilon-\delta εδ表達, ∀ ϵ > 0 \forall \epsilon>0 ϵ>0,令 δ = ε \delta=\varepsilon δ=ε,使得 0 < ∣ x − x 0 ∣ < δ 0<|x-x_0|<\delta 0<xx0<δ ∣ x − x 0 ∣ < ϵ |x-x_0|<\epsilon xx0<ϵ

換句話說,當 x → x 0 x\rightarrow x_0 xx0 Δ x \Delta x Δx是一個無窮小函數,且 Δ x ≠ 0 \Delta x\ne 0 Δx=0,因為一旦求極限,by definition,定義在 x 0 x_0 x0的去心鄰域,而不是鄰域,所以 Δ x ≠ 0 \Delta x\ne 0 Δx=0。如果 x → x 0 − x\rightarrow {x_0}^- xx0,即 x x x x 0 x_0 x0的左側趨向於 x 0 x_0 x0,就是座標軸上,從負向往正向趨向於 x 0 x_0 x0,或者說從比 x 0 x_0 x0小的數趨向於 x 0 x_0 x0,或者說按地圖默認方向上北下南左西右東,從西側向東趨向於 x 0 x_0 x0,那麽, Δ x < 0 \Delta x<0 Δx<0。反之, x → x 0 + x\rightarrow {x_0}^+ xx0+ Δ x > 0 \Delta x>0 Δx>0。在微分中, Δ x \Delta x Δx又寫成 d x \mathrm{d}x dx,我們一般直覺地想到函數求面積,割成無數個密密緊緊的小的矩形, d x \mathrm{d}x dx X X X軸上的小小的短線。這樣神秘化 d x \mathrm{d}x dx了,混淆了微分和積分,積分中 Δ x \Delta x Δx是在乘數的位置,是求函數面積。是求極限中的 x 0 x_0 x0不停地移動。如果積分區間的第一個數是 x 0 x_0 x0,第一個 d x \mathrm{d}x dx區間是 ( x 0 , x 1 ] (x_0,x_1] (x0,x1] d x = x 1 − x 0 \mathrm{d}x=x_1-x_0 dx=x1x0,第2個積分區間是 ( x 1 , x 2 ] (x_1,x_2] (x1,x2] d x = x 2 − x 1 \mathrm{d}x=x_2-x_1 dx=x2x1,……。求導中 d x = Δ x = x − x 0 \mathrm{d}x=\Delta x=x-x_0 dx=Δx=xx0,放在分母,當 x → x 0 x\rightarrow x_0 xx0,是無窮小,但 d x = Δ x ≠ 0 \mathrm{d}x=\Delta x\ne 0 dx=Δx=0,所以其寫在分母的位置,我們沒有條件反射似的趕緊註明『分母不為零』。我們可不能簡單地將 d x \mathrm{d}x dx中的 d \mathrm{d} d視為普通字母 d d d,也是一個函數的標識,就像 f ( x ) f(x) f(x) f f f。數學公式中所有代表變量的字母甚至代表函數的字母都是斜體,可是 d x \mathrm{d}x dx中的 d \mathrm{d} d是正體。 d x \mathrm{d}x dx我們要視為 d ( x ) = x − x 0 \mathrm{d}(x)=x-x_0 d(x)=xx0,當 x → x 0 x\rightarrow x_0 xx0,一個無窮小, lim ⁡ x → x 0 d x = lim ⁡ x → x 0 Δ x = lim ⁡ x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}\mathrm{d}x=\lim \limits_{x\rightarrow x_0}\Delta x=\lim \limits_{x\rightarrow x_0}(x-x_0)=0 xx0limdx=xx0limΔx=xx0lim(xx0)=0

我們來看 Δ y \Delta y Δy Δ y = f ( x ) − f ( x 0 ) = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x)-f(x_0)=f(x_0+\Delta x)-f(x_0) Δy=f(x)f(x0)=f(x0+Δx)f(x0),當 f ( x ) f(x) f(x) x 0 x_0 x0導數存在時, lim ⁡ x → x 0 Δ y Δ x = f ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{\Delta y}{\Delta x}=f'(x_0) xx0limΔxΔy=f(x0),如果 f ′ ( x 0 ) = 0 f'(x_0)=0 f(x0)=0,則, x → x 0 x\rightarrow x_0 xx0時, Δ y \Delta y Δy Δ x \Delta x Δx的高階無窮小, Δ y = o ( Δ x ) \Delta y=o(\Delta x) Δy=o(Δx);如果 f ′ ( x 0 ) ≠ 0 f'(x_0)\ne 0 f(x0)=0 f ′ ( x 0 ) f'(x_0) f(x0)是個非零的常數,那麽 Δ y \Delta y Δy Δ x \Delta x Δx的同階無窮小。總之,如果 x 0 x_0 x0點導數存在,當 x → x 0 x\rightarrow x_0 xx0 Δ y \Delta y Δy必是無窮小,如果 Δ y = f ( x ) − f ( x 0 ) \Delta y=f(x)-f(x_0) Δy=f(x)f(x0)這麽定義 Δ y \Delta y Δy是自變量為 x x x的無窮小,如果 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)f(x0)這麽定義, Δ y \Delta y Δy的自變量是 Δ x \Delta x Δx,還是個複合函數(即嵌套函數),因為 Δ x = x − x 0 \Delta x=x-x_0 Δx=xx0。當 x → x 0 x\rightarrow x_0 xx0 Δ y \Delta y Δy是無窮小, lim ⁡ x → x 0 Δ y = lim ⁡ x → x 0 [ f ( x ) − f ( x 0 ) ] = 0 ⇒ lim ⁡ x → x 0 f ( x ) = f ( x 0 ) \lim \limits_{x \rightarrow x_0}\Delta y=\lim \limits_{x \rightarrow x_0}[f(x)-f(x_0)]=0 \Rightarrow \lim \limits_{x \rightarrow x_0}f(x)=f(x_0) xx0limΔy=xx0lim[f(x)f(x0)]=0xx0limf(x)=f(x0),即 f ( x ) f(x) f(x) x 0 x_0 x0連續。所以,函數在某點可導必連續。

可以看出來,求極限是在某點的去心鄰域求 f ( x ) f(x) f(x)極限,求導是連續函數在某點的去心鄰域求導。能不能直接說求導是某點的鄰域求導?可以的,因為求導這一運算包括了『判斷連續』和『求極限』兩個操作。能不能說求導是在某點的鄰域 Δ y Δ x \frac{\Delta y}{\Delta x} ΔxΔy求極限呢?不能,求極限只能在去心鄰域求極限。

求導必某點求導,是函數在此點有定義,且在此點去心鄰域 Δ y Δ x \frac{\Delta y}{\Delta x} ΔxΔy求極限。所以導函數怎麼理解?我們背誦的求導公式,比如, ( sin ⁡ x ) ′ = cos ⁡ x (\sin x)'=\cos x (sinx)=cosx,真正的含義是 ( sin ⁡ x ) ′ ∣ x = x 0 = cos ⁡ x 0 (\sin x)'|_{x=x_0}=\cos x_0 (sinx)x=x0=cosx0。又因為 ( sin ⁡ x ) ′ ∣ x = x 1 = cos ⁡ x 1 (\sin x)'|_{x=x_1}=\cos x_1 (sinx)x=x1=cosx1,所以,這裏有一個pattern, ( sin ⁡ x ) ′ ∣ x = x 0 = cos ⁡ x ∣ x = x 0 (\sin x)'|_{x=x_0}=\cos x|_{x=x_0} (sinx)x=x0=cosxx=x0,所以稱 sin ⁡ x \sin x sinx的導函數是 cos ⁡ x \cos x cosx,記作 ( sin ⁡ x ) ′ = cos ⁡ x (\sin x)'=\cos x (sinx)=cosx

所以我們可以這樣理解導數和導函數:

導數』:在函數 y = f ( x ) y=f(x) y=f(x)的定義域 D f D_f Df上取任意一點 x 0 x_0 x0,當 x x x x 0 x_0 x0的去心鄰域變化,得到增量 Δ x \Delta x Δx,相應地,因變量取得增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y=f(x_0+\Delta x)-f(x_0) Δy=f(x0+Δx)f(x0)。如果 Δ y \Delta y Δy Δ x \Delta x Δx之比當 Δ x → 0 \Delta x\rightarrow 0 Δx0極限存在,那麽稱函數 y = f ( x ) y=f(x) y=f(x) x 0 x_0 x0可導,並稱這個極限為 f ( x ) f(x) f(x)在點 x 0 x_0 x0的導數,記為 d f ( x ) d x ∣ x = x 0 \frac{d{f(x)}}{dx}\big|_{x=x_0} dxdf(x) x=x0

d f ( x ) d x ∣ x = x 0 = lim ⁡ x → x 0 Δ y Δ x = lim ⁡ x → x 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x = g ( x 0 ) \frac{d{f(x)}}{dx}\big|_{x=x_0}=\lim \limits_{x\rightarrow x_0}\frac{\Delta y}{\Delta x}=\lim \limits_{x\rightarrow x_0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}=g(x_0) dxdf(x) x=x0=xx0limΔxΔy=xx0limΔxf(x0+Δx)f(x0)=g(x0)

導函數』:由於 x 0 x_0 x0是定義域 D f D_f Df上任意點, g ( x 0 ) = g ( x ) ∣ x = x 0 g(x_0)=g(x)|_{x=x_0} g(x0)=g(x)x=x0,稱 g ( x ) g(x) g(x) f ( x ) f(x) f(x)的導函數,記作 f ′ ( x ) = g ( x ) = y ′ f'(x)=g(x)=y' f(x)=g(x)=y f ( x ) f(x) f(x)在點 x 0 x_0 x0的導數為 g ( x 0 ) = g ( x ) ∣ x = x 0 = f ′ ( x ) ∣ x = x 0 = f ′ ( x 0 ) g(x_0)=g(x)|_{x=x_0}=f'(x)|_{x=x_0}=f'(x_0) g(x0)=g(x)x=x0=f(x)x=x0=f(x0)

以下證明鏈式法則。

鏈式法則 如果 u = g ( x ) u=g(x) u=g(x) 在點 x 0 x_0 x0可導,而 y = f ( u ) y=f(u) y=f(u)在點 u 0 = g ( x 0 ) u_0=g(x_0) u0=g(x0)可導,則複合函數 u = f [ g ( x ) ] u=f[g(x)] u=f[g(x)]在點 x 0 x_0 x0可導,且導數為
d y d x ∣ x = x 0 = f ′ ( g ( x 0 ) ) ⋅ g ′ ( x 0 ) . \frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(g(x_0))\cdot g'(x_0). dxdy x=x0=f(g(x0))g(x0).

證:按定義, d y d x ∣ x = x 0 = lim ⁡ x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] x − x 0 \displaystyle \frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=\lim \limits_{x\rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0} dxdy x=x0=xx0limxx0f[g(x)]f[g(x0)]

嵌套函數求極限,代換, u = g ( x ) u=g(x) u=g(x)
lim ⁡ x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] x − x 0 = lim ⁡ x → x 0 ( f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 u − u 0 x − x 0 ) (公式1) \lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0}=\lim \limits_{x \rightarrow x_0}\left (\frac{f[g(x)]-f[g(x_0)]}{u-u_0}\frac{u-u_0}{x-x_0}\right ) \text{(公式1)} xx0limxx0f[g(x)]f[g(x0)]=xx0lim(uu0f[g(x)]f[g(x0)]xx0uu0)(公式1)

lim ⁡ x → x 0 u − u 0 x − x 0 \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0} xx0limxx0uu0極限存在, lim ⁡ x → x 0 u − u 0 x − x 0 = g ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0}=g'(x_0) xx0limxx0uu0=g(x0),我們來證明 lim ⁡ x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 \lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{u-u_0} xx0limuu0f[g(x)]f[g(x0)]極限存在。

因為 lim ⁡ u → u 0 f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 = f ′ ( u 0 ) \lim \limits_{u \rightarrow u_0}\frac{f[g(x)]-f[g(x_0)]}{u-u_0}=f'(u_0) uu0limuu0f[g(x)]f[g(x0)]=f(u0),用 ε − δ \varepsilon-\delta εδ表示, ∀ ε 1 > 0 \forall \varepsilon_1>0 ε1>0 ∃ δ 1 > 0 \exists \delta_1>0 δ1>0,使得一切 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<uu0<δ1 ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 uu0f(u)f(u0)f(u0)<ε1

思路:現在 x → x 0 x\rightarrow x_0 xx0,如果我們能找到 x 0 x_0 x0的某個去心鄰域,使得 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<uu0<δ1,則 x 0 x_0 x0的這個去心鄰域內, ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 uu0f(u)f(u0)f(u0)<ε1

因為 lim ⁡ x → x 0 u − u 0 x − x 0 \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0} xx0limxx0uu0極限存在, lim ⁡ x → x 0 u − u 0 x − x 0 = g ′ ( x 0 ) \lim \limits_{x\rightarrow x_0}\frac{u-u_0}{x-x_0}=g'(x_0) xx0limxx0uu0=g(x0),所以 lim ⁡ x → x 0 ( u − u 0 ) = lim ⁡ x → x 0 [ ( u − u 0 ) x − x 0 ( x − x 0 ) ] = lim ⁡ x → x 0 ( u − u 0 ) x − x 0 lim ⁡ x → x 0 ( x − x 0 ) = 0 \lim \limits_{x\rightarrow x_0}(u-u_0)=\lim \limits_{x\rightarrow x_0}[\frac{(u-u_0)}{x-x_0}(x-x_0)]=\lim \limits_{x\rightarrow x_0}\frac{(u-u_0)}{x-x_0}\lim \limits_{x\rightarrow x_0}(x-x_0)=0 xx0lim(uu0)=xx0lim[xx0(uu0)(xx0)]=xx0limxx0(uu0)xx0lim(xx0)=0

lim ⁡ x → x 0 ( u − u 0 ) = 0 \lim \limits_{x\rightarrow x_0}(u-u_0)=0 xx0lim(uu0)=0,用 ε − δ \varepsilon-\delta εδ表示,令 ε 2 = δ 1 \varepsilon_2=\delta_1 ε2=δ1 ∃ δ 2 > 0 \exists \delta_2>0 δ2>0,使得 0 < ∣ x − x 0 ∣ < δ 2 0<|x-x_0|<\delta_2 0<xx0<δ2 ∣ u − u 0 ∣ < ε 2 = δ 1 |u-u_0|<\varepsilon_2=\delta_1 uu0<ε2=δ1

又因為 ∣ x − x 0 ∣ > 0 |x-x_0|>0 xx0>0,如果此去心鄰域內一切 u = u 0 u= u_0 u=u0,那 u = g ( x ) = g ( x 0 ) = c 0 u=g(x)=g(x_0)=c_0 u=g(x)=g(x0)=c0是個常數函數, c 0 c_0 c0是常數,所以, f [ g ( x ) ] = f ( c 0 ) ] f[g(x)]=f(c_0)] f[g(x)]=f(c0)]也是常數函數,常數函數不含變量,不是複合函數。就算 g ( x ) g(x) g(x)是一個分段函數,在點 x 0 x_0 x0的去心鄰域是常數,那麽,不會 g ( x ) g(x) g(x)的整個定義域 D g D_g Dg g ( x ) g(x) g(x)是常數,我們取 x 0 x_0 x0位於分段函數非常數的子域。而分段函數為常數的子域, f ( g ( x 0 ) ) = c 0 f(g(x_0))=c_0 f(g(x0))=c0,導數為 0 0 0 g ′ ( x 0 ) = 0 g'(x_0)=0 g(x0)=0 f ′ ( g ( x 0 ) ) = 0 f'(g(x_0))=0 f(g(x0))=0 f ′ ( g ( x 0 ) ) = f ′ ( g ( x 0 ) ) ⋅ g ′ ( x 0 ) = 0 f'(g(x_0))=f'(g(x_0))\cdot g'(x_0)=0 f(g(x0))=f(g(x0))g(x0)=0,trivial。

g ( x ) g(x) g(x)在定義域某子域非常數函數, x 0 x_0 x0位於該子域,一切 x x x x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)不可能一切 u = u 0 u= u_0 u=u0

如果一切 x x x x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)時,一切 u ≠ u 0 u\ne u_0 u=u0,那我們找到了 x 0 x_0 x0的這個去心鄰域,使得 ∀ ε 1 > 0 \forall \varepsilon_1>0 ε1>0 ∃ δ 2 > 0 \exists \delta_2>0 δ2>0,當 0 < ∣ x − x 0 ∣ < δ 2 0<|x-x_0|<\delta_2 0<xx0<δ2時, 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<uu0<δ1 ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 uu0f(u)f(u0)f(u0)<ε1

如果,一切 x x x x 0 x_0 x0去心鄰域 U ˚ ( x 0 , δ 2 ) \mathring{U}(x_0,\delta_2) U˚(x0,δ2)時,存在一些點 x 1 , x 2 , . . . , x i , . . . ( i ∈ N + , x i ≠ x 0 , x 1 < x 2 < . . . < x i < . . . ) x_1,x_2,...,x_i,...(i\in\mathrm{N}_+,x_i\ne x_0,x_1<x_2<...<x_i<...) x1,x2,...,xi,...(iN+xi=x0x1<x2<...<xi<...),使得 u ( x i ) = u 0 u(x_i)=u_0 u(xi)=u0,那麽,取第一個最靠近 x 0 x_0 x0的點 x j x_j xj,令 ∣ x j − x 0 ∣ = m i n { ∣ x 1 − x 0 ∣ , ∣ x 2 − x 0 ∣ , . . . , ∣ x i − x 0 ∣ , . . . } |x_j-x_0|=min\{|x_1-x_0|,|x_2-x_0|,...,|x_i-x_0|,...\} xjx0=min{x1x0,x2x0,...,xix0,...},令 δ 3 = ∣ x 0 − x j ∣ \delta_3=|x_0-x_j| δ3=x0xj,當 x x x在這個去心鄰域 U ˚ ( x 0 , δ 3 ) \mathring U(x_0,\delta_3) U˚(x0,δ3) ∣ u − u 0 ∣ > 0 |u-u_0|>0 uu0>0。這樣我們找到了這個 x 0 x_0 x0去心鄰域,對於 ∀ ε 1 > 0 \forall \varepsilon_1>0 ε1>0,當一切 x ∈ U ˚ ( x 0 , δ 3 ) x\in\mathring U(x_0,\delta_3) xU˚(x0,δ3) 0 < ∣ u − u 0 ∣ < δ 1 0<|u-u_0|<\delta_1 0<uu0<δ1 ∣ f ( u ) − f ( u 0 ) u − u 0 − f ′ ( u 0 ) ∣ < ε 1 |\frac{f(u)-f(u_0)}{u-u_0}-f'(u_0)|<\varepsilon_1 uu0f(u)f(u0)f(u0)<ε1

故, lim ⁡ x → x 0 f ( u ) − f ( u 0 ) u − u 0 \lim \limits_{x\rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0} xx0limuu0f(u)f(u0)極限存在, lim ⁡ x → x 0 f ( u ) − f ( u 0 ) u − u 0 = f ′ ( u 0 ) \lim \limits_{x\rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0}=f'(u_0) xx0limuu0f(u)f(u0)=f(u0)

函數積的極限=極限的積,公式1為:

lim ⁡ x → x 0 f [ g ( x ) ] − f [ g ( x 0 ) ] x − x 0 = lim ⁡ x → x 0 ( f [ g ( x ) ] − f [ g ( x 0 ) ] u − u 0 u − u 0 x − x 0 ) = lim ⁡ x → x 0 f ( u ) − f ( u 0 ) u − u 0 lim ⁡ x → x 0 u − u 0 x − x 0 = f ′ ( u 0 ) u ′ ( x 0 ) = f ′ ( g ( x 0 ) ) ⋅ g ′ ( x 0 ) \lim \limits_{x \rightarrow x_0}\frac{f[g(x)]-f[g(x_0)]}{x-x_0}=\lim \limits_{x \rightarrow x_0}\left (\frac{f[g(x)]-f[g(x_0)]}{u-u_0}\frac{u-u_0}{x-x_0}\right ) =\lim \limits_{x \rightarrow x_0}\frac{f(u)-f(u_0)}{u-u_0}\lim \limits_{x \rightarrow x_0}\frac{u-u_0}{x-x_0} =f'(u_0)u'(x_0) =f'(g(x_0))\cdot g'(x_0) xx0limxx0f[g(x)]f[g(x0)]=xx0lim(uu0f[g(x)]f[g(x0)]xx0uu0)=xx0limuu0f(u)f(u0)xx0limxx0uu0=f(u0)u(x0)=f(g(x0))g(x0)

Q.E.D.


附錄 不同《高等數學》課本對鏈式法則的定義

《高等數學(第三版)上冊》(1995)的定義如下。

鏈式法則 如果 u = ϕ ( x ) u=\phi (x) u=ϕ(x) 在點 x 0 x_0 x0可導,而 y = f ( u ) y=f(u) y=f(u)在點 u 0 = ϕ ( x 0 ) u_0=\phi(x_0) u0=ϕ(x0)可導,則複合函數 u = f [ ϕ ( x ) ] u=f[\phi(x)] u=f[ϕ(x)]在點 x 0 x_0 x0可導,且導數為
d y d x ∣ x = x 0 = f ′ ( ϕ ( x 0 ) ) ⋅ ϕ ′ ( x 0 ) \frac{\mathrm{d}y}{\mathrm{d}x}\Big|_{x=x_0}=f'(\phi(x_0))\cdot\phi'(x_0) dxdy x=x0=f(ϕ(x0))ϕ(x0)

《高等數學(第七版)上冊》(2015)的定義如下。

鏈式法則 如果 u = g ( x ) u=g(x) u=g(x) 在點 x x x可導,而 y = f ( u ) y=f(u) y=f(u)在點 u = g ( x ) u=g(x) u=g(x)可導,則複合函數 u = f [ g ( x ) ] u=f[g(x)] u=f[g(x)]在點 x x x可導,且導數為
d y d x = f ′ ( ϕ ( x ) ) ⋅ ϕ ′ ( x ) 或 d y d x = d y d x ⋅ d u d x \frac{\mathrm{d}y}{\mathrm{d}x}=f'(\phi(x))\cdot\phi'(x) \text{或}\frac{dy}{dx}=\frac{dy}{dx}\cdot \frac{du}{dx} dxdy=f(ϕ(x))ϕ(x)dxdy=dxdydxdu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值