定理1 令A是Rn中的开集并且假设f:A→Rm在x0处可微,那么Df(x0)是由f唯一确定。
证明:令L1,L2是满足定义1的两个线性映射,我们必须说明L1=L2。固定e∈Rn,∥e∥=1,对λ∈R令x=x0+λe,那么注意
|λ|=∥x−x0∥∥L1⋅e−L2⋅e=∥L1⋅λe−L2⋅λe∥|λ|
因为A是开集,所以λ充分小时x∈A,根据三角不等式
∥L1⋅e−L2⋅e∥=∥L1(x−x0)−L2(x−x0)∥∥x−x0∥≤∥f(x)−f(x0)−L1(x−x0)∥∥x−x0∥+∥f(x)−f(x0)−L2(x−x0)∥∥x−x0∥
当λ→0时,上式的两项均→0,所以L1⋅e=L2⋅e。 除了∥e∥=1时e的选择是任意的,但是对任意y∈Rn,y/∥y∥=e长度为1,利用线性可知,如果L1(e)=L2(e),那么L1(y)=L2(y)。||
定理2 假设A⊂Rn是一个开集并且f:A→Rm是可微的,那么偏微分∂fj/∂xi存在且线性映射Df(x)对于Rn,Rm 中标准基的矩阵为
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜∂f1∂x1∂f2∂x1⋅⋅⋅∂fm∂x1∂f1∂x2∂f2∂x2⋅⋅⋅∂fm∂x2⋯⋯⋯∂f1∂xn∂f2∂xn⋅⋅⋅∂fm∂xn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
其中每个偏导数都是在x=(x1,…,xn)处计算出来的。
证明:根据线性映射矩阵的定义,Df(x)的第ji 个矩阵元素是向量Df(x)⋅ei的第j个元素,也就是Df(x)作用到第i个标准基ei上,我们称为aji。 接下来令y=x+hei,其中h∈R,注意
∥f(y)−f(x)−Df(x)⋅(y−x)∥y−x∥=∥f(x1,…,xi+h,…,xn)−f(x1,…,xn)−hDf(x)⋅ei∥|h|
因为当h→0时上面的式子→0,所以分子的第j个元素同样如此,这就意味着当h→0,
|fj(x1,…,xi+h,…,xn)−fj(x1,…,xn)−haji||h|→0
因此我们有
aji=limh→0[fj(x1,…,xi+h,xn)−fj(x1,…,xn)]h=∂fj∂xi||
定理3 假设A⊂Rn是开集且f:A→Rm在A上可微,那么f是连续的。事实上,对于每个x0∈A存在一个常数M>0,δ0>0 使得∥x−x0∥<δ0意味着∥f(x)−f(x0)∥≤M∥x−x0∥。(这就是利普希茨(Lipschitz)性质)
为了证明这个定理,我们回忆一下,如果L:Rn→Rm是一个线性变化,那么存在一个常数M0使得对所有的x∈Rn不等式∥Lx∥≤M0∥x∥,因此我们取L=Df(x0)。
证明:为了证明连续性,只要证明利普希茨性质即可,对给定的ε>0,我们可以选择δ=min(δ0,ε/M)。为此我们令定义1 中的ε=1,那么存在一个δ0使得∥x−x0∥<δ0意味着
∥f(x)−f(x0)−Df(x0)(x−x0)∥≤∥x−x0∥
变换一下得
∥f(x)−f(x0)∥≤∥Df(x0)(x−x0)∥+∥x−x0∥
(这里我们使用了三角不等式∥y∥−∥z∥≤∥y−z∥,这要对y=(y−z)+z应用通常的三角不等式即可得出该结果)。令M=M0+1并利用事实∥Df(x0)(x−x0)∥≤M0∥x−x0∥ 得出结论。||
定理4 令A⊂Rn是一个开集,f:A⊂Rn→Rm,假设f=(f1,…,fm)。如果每个偏导∂fj/∂xj存在且在A上连续,那么f在A上可微。
证明:如果Df(x)存在,那么它的矩阵表示就是定理2 中的雅克比矩阵,从而我们需要说明当x∈A固定,对于任意的ε>0,存在δ>0使得∥y−x∥<δ,y∈A意味着
∥f(y)−f(x)−Df(x)(y−x)∥<ε∥y−x∥
为此,只要证明f中每个元素满足即可,因此我们假设m=1。
我们可以写成f(y)−f(x)=f(y1,…,yn)−f(x1,y2,…,yn)+f(x1,y2,…,yn)−f(x1,x2,y3,…,yn)+f(x1,x2,y3,…,yn)−f(x1,x2,x3,y4,…,yn)+⋯+f(x1,…,xn−1,yn)−f(x1,…,xn),接下来我们利用均值定理,在x1,y1(y2,…,yn 固定)之间存在u1使得f(y1,…,yn)−f(x1,y2,…,yn)=∂f/∂x1(u1,y2,…,yn)(y1−x1),对于其他项我们可以写出同样的表达式从而得到
f(y)−f(x)=(∂f∂x1(u1,y2,…,yn))(y1−x1)+(∂f∂x2(x1,u2,…,yn))(y2−x2)+⋯+(∂f∂x1(x1,x2,…,xn−1,un))(yn−xn)
那么因为Df(x)(y−x)=Σni=1∂f∂xi(x1,…,xn)(yi−xi),所以
∥f(y)−f(x)−Df(x)(y−x)∥≤{∣∣∣∂f∂x1(u1,y2,…,yn)−∂f∂x1(x1,…,xn)∣∣∣+⋯+∣∣∣∂f∂xn(x1,…,xn−1,un)−∂f∂xn(x1,…,xn)∣∣∣}∥y−x∥
其中利用了三角不等于以及事实|yi−xi|≤∥y−x∥。但是∂f/∂xi是连续的并且ui位于yi,xi之间,所以存在δ>0使得大括号中的项在∥y−x∥<δ时小于ε,这就证明了断言。||
定理5 令f:A→Rm在开集A⊂Rn上是可微的,g:B→Rp在开集B⊂Rm上是可微的,假设f(A)⊂B,那么复合函数(composite)g∘f 在A上是可微的且D(g∘f)(x0)=Dg(f(x0))∘Df(x0)。
证明:为了说明D(g∘f)(x0)⋅y=Dg(f(x0))⋅(Df(x0)⋅y),我们想说明
limx→x0∥g∘f(x)−g∘f(x0)−Dg(f(x0))⋅(Df(x0)(x−x0))∥∥x−x0∥=0
为此估计一下分子:
∥g∘f(x)−g∘f(x0)−Dg(f(x0))⋅(Df(x0)(x−x0))∥=∥g(f(x))−g(f(x0))−Dg(f(x0))(f(x)−f(x0))+Dg(f(x0))(f(x)−f(x0)−Df(x0)(x−x0))∥≤∥g(f(x))−g(f(x0))−Dg(f(x0))(f(x)−f(x0))∥+∥Dg(f(x0))(f(x)−f(x0)−Df(x0)(x−x0))∥
因为f是可微的,所以根据定理3存在δ0,M>0 使得∥x−x0∥<δ0 时∥f(x)−f(x0)∥≤M。接下来给定ε>0,根据导数的定义,存在δ1>0使得∥y−f(x0)∥<δ1意味着
∥g(y)−g(f(x0))−Dg(f(x0))(y−f(x0))∥<(ε2M)∥y−f(x0)∥
从而∥x−x0∥<δ2=min{δ0,δ1}意味着
∥g(f(x))−g(f(x0))−Dg(f(x0))(f(x)−f(x0))∥∥x−x0∥<ε2
因为Dg(f(x0))是一个线性映射,所以我们知道存在一个常数M~使得对所有的y∈Rm,∥Dg(f(x0))(y)≤M~⋅∥y∥,其中可以假设M~≠0。接下里根据导数的定义存在δ3>0使得∥x−x0∥<δ3意味着
∥f(x)−f(x0)−Df(x0)(x−x0)∥∥x−x0∥<ε2M~
那么∥x−x0∥<δ3意味着
∥Dg(f(x0))(f(x)−f(x0)−Df(x0)(x−x0))∥∥x−x0∥≤M~⋅∥f(x)−f(x0)−Df(x0)(x−x0)∥∥x−x0∥<ε2
令
δ=min{δ2,δ3},那么
∥x−x0∥<δ意味着
∥g∘f(x)−g∘f(x0)−Dg(f(x0))⋅Df(x0)(x−x0)∥∥x−x0∥≤∥g(f(x))−g(f(x0))−Dg(f(x0))(f(x)−f(x0))∥∥x−x0∥+∥Dg(f(x0))(f(x)−f(x0)−Df(x0)(x−x0))∥∥x−x0∥<ε2+ε2=ε
证毕。||
定理6 令A⊂Rn是开集,f:A→Rm,g:A→R是可微函数,那么gf是可微的并且对于x∈A,D(gf)(x):Rn→Rm为D(gf)(x)⋅e=g(x)(Df(x)⋅e)+(Dg(x)⋅e)f(x),对所有的e∈Rn均如此。
证明:给定ε>0,x0∈A,选择δ>0使得∥x−x0∥<δ意味着
- |g(x)|≤|g(x0)|+1=M;
- ∥f(x)−f(x0)−Df(x0)(x−x0)∥≤ε3M∥x−x0∥;
- ∥g(x)−g(x0)−Dg(x0)(x−x0)∥≤ε3∥f(x0)∥∥x−x0∥;
- ∥g(x)−g(x0)∥≤ε3M
其中∥Df(x0)y∥≤M∥y∥(如果f(x0)≠=0,Df(x0)≠,那么只需要(iii),(iv)即可)
那么对于∥x−x0∥<δ,利用三角不等式得
∥g(x)f(x)−g(x0)f(x0)−g(x0)Df(x0)(x−x0)−[Dg(x0)(x−x0)]f(x0)∥≤∥g(x)f(x)−g(x)f(x0)−g(x)Df(x0)(x−x0)∥+∥g(x)Df(x0)(x−x0)−g(x0)Df(x0)(x−x0)∥+∥g(x)f(x0)−g(x0)f(x0)−[Dg(x0)(x−x0)]∥≤M⋅ε∥x−x0∥3M+ε3MM∥x−x0∥+ε∥x−x0∥3∥f(x0)∥⋅∥f(x0)∥=ε∥x−x0∥.||
定理7
(i)假设f:A⊂Rn→R在开集A上可微,对于使得x,y 之间的线段位于A中的任意x,y∈A,存在点c位于那条线段上使得
f(y)−f(x)=Df(c)(y−x)
(ii)假设f:A⊂Rn→Rm在开集A上可微,假设连接x,y的线段位于A中并且f=(f1,…,fm),那么在那条线段上存在点c1,…,cm使得
fi(y)−fi(x)=Dfi(ci)(y−x),i=1,…,m
证明:(i)考虑函数h:[0,1]→R,定义为h(t)=f((1−t)x+ty),函数h在(0,1)上对t可微,那么根据均值定理,存在t0∈(0,1)使得h(1)−h(0)=h′(t0)(1−0),现在h(1)=f(y),h(0)=f(x)。利用链式法则求微分可得h′(t0)=Df((1−t0)x+t0y)(y−x),其中(1−t)x+ty对t的导数是y−x,从而我们可以取c=(1−t0)x+t0y。
(ii)对f的每个元素分别应用(i) 即可。||
定理8 令f:A⊂Rn→R在开集A上二阶可导,那么D2f(x):Rn×Rn→R对于标准基的矩阵为
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜∂2f∂x1∂x1⋅⋅⋅∂2f∂xn∂x1⋯⋯∂2f∂x1∂xn⋅⋅⋅∂2f∂xn∂xn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
其中每个偏微分都是在点x=(x1,…,xn)处进行计算。
证明:Df:A→Rn的矩阵表示由行向量(∂f/∂x1,…,∂f/∂xn)给出,那么根据定理2,D2f:A→Rn2为
⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜∂2f∂x1∂x1⋅⋅⋅∂2f∂xn∂x1∂2f∂x1∂x2∂2f∂xn∂x2⋯⋯∂2f∂x1∂xn⋅⋅⋅∂2f∂xn∂xn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
证毕。||