定理9 令f:A→R在开集A上二阶可导且D2f连续(即函数∂2f/(∂xi∂j)是连续的),那么D2f是对称的;即
D2f(x)(x1,x2)=D2f(x)(x2,x1)
或者用元素的方式表示就是
∂2f∂xi∂xj=∂2f∂xj∂xi
证明:我们想说明D2f(x)⋅(y,z)=D2f(x)⋅(z,y);即
δ2fδxiδxj=δ2fδxjδxi
对所有标量都成立,我们化简到二维情况,从而可以假设f 在A⊂R2 上是C2类并且是实值函数。
对于固定的(x,y)∈A与很小的h,k,
Sh,k=[f(x+h,y+k)−f(x,y+k)]−[f(x+h,y)−f(x,y)]
(如图1)
图1
将函数gk定义为gk(u)=f(u,y+k)−f(u,y),那么Sh,k可以写成
Sh,k=gk(x+h)−gk(x)
那么根据均值定理,在x,x+h之间存在某个ck,h使得Sh,k=g′k(ck,h)⋅h,故y,y+h之间存在某个dh,k使得
Sh,k={∂f∂x(ck,h,y+k)−∂f∂x(ck,h,y)}⋅h=∂2f∂y∂x(ck,h,dk,h)⋅hk
接下来,Sh,k关于h,k与x,y是对称的,交换Sh,k中间的两项,我们可以导出
Sh,k=∂2fch,k~,dh,k~⋅hk
联立Sh,k的两个等式,消去h,k并令h→0,k→0 即可得出结论。||
注意:更精细的结论是:如果f是C1且∂f/∂x∂y存在并连续,那么∂2f∂y∂x存在且相等,证明的话比上面的复杂,这里从略,但是思想都是一样的。
定理10 对开集A⊂Rn,令f:A→R 是Cr类,令x,y∈A并且假设连接x,y的线段位于A 中,那么在这条线段上存在点c 使得
f(y)−f(x)=∑k=1r−11k!Dkf(x)(y−x,…,y−x)+1r!Dr(c)(y−x,…,y−x)
证明:根据链式法则
ddtf(t+th)=Df(x+th)⋅h=∑i=1n∂f∂xi(x+th)hi
那么我们从t=0到t=1进行积分可得
f(x+h)−f(x)=∫10∑i=1n∂f∂xi(x+th)hidt
接下来是求右边的积分表达式,回忆一下公式
∫10udvdtdt=−∫10vdudtdt+uv|10
我们令u=(∂f/∂xi)(x+th)hi,v=t−1,那么
∑i=1n∫10∂f∂xi(x+th)hidt−∑i,k=1n∫10(1−t)∂2f∂xi∂xk(x+th)hihkdt+hi∂f∂xi(x)
这是因为根据链式法则
dudt=∂2f∂xi∂xk(x+th)hihk
以及
uv|10=(t−1)∂f∂xi(x+th)hi|1t=0=∂f∂xi(x)hi
,从而我们证明了
f(x+h)−f(x)=∑i=1n∂f∂xi(x)⋅hi+R1(h,x)
其中
R1(h,x)=∑i,k=1n∫10(1−t)∂2f∂xi∂xk(x+th)hihkdt.
因为|hi|≤∥h∥,所以我们有
|R1(h,x0)|≤∥h∥2⎧⎩⎨∑i,k=1n∫10(1−t)∣∣∣∂2f∂xi∂xk(x0+th)∣∣∣dt⎫⎭⎬
如果我们用
u=∂2f∂xi∂xk(x+th)hihk
以及
v=−(t−1)2/2
积分R1(h,x0)可得
R1(h,x)=∑i,j,k∫10(t−1)22∂3f∂xi∂xj∂xk(x+th)hihjhkdt+∑i,j12∂2f∂xi∂xj(x)hihj
所以我们证明了
f(x+h)=f(x)+∑i=1nhi∂f∂xi(x)+∑i,j=1nhihj2∂2f∂xi∂xj(x)+R2(h,x)
其中
R2(h,x)=∑i,j,kn∫10(t−1)22∂3f∂xi∂xj∂xk(x+th)hihjhkdt
现在最后公式中的积分项是连续函数,所以在x的小邻域内是有界的(记住它非常接近x处的函数值),那么对常数M≥0,存在很小的∥h∥使得
|R2(h,x)|≤∥h∥3M
尤其注意到当h→0时R2(h,x0)/∥h∥2≤∥h∥M→0,回忆一下
∫baf(x)g(x)dx=f(c)∫bag(x)dx
其中f,g是连续的且在[a,b]上g≥0;c是a,b中的某个值。从而我们得出
R1(h,x0)=∑i,k=1n∫10(1−t)∂2f∂xi∂xk(x+th)hihkdt=∫10(1−t)D2f(x+th)(h,h)dt=12D2f(c)(h,h)
其中c在连接x,y=x+h的线上。
同样的,
R2(h,x0)=∑i,j,k=1n∫10(t−1)22∂3f∂xi∂xj∂xk(x+th)hihjhkdt=∫10(t−1)22D3f(x+th)⋅(h,h,h)dt=13!D3f(c)⋅(h,h,h)
其中c在连接x,y=x+h的线上,利用归纳法我们可以用同样的方法处理从而得出一般的结论。||
注:1,实际上我们可以证明更强的定理,即如果f是Cr,那么
f(x+h)=f(x)+∑k=1r1k!Dkf(x)⋅(h,…,h)+Rr(x,h)
其中h∈Rn,当h→0时Rr(x,h)/∥h∥r→0。
2,定理10的另一种证明是利用泰勒公式,令g(t)=f(x+t(y−x)),x∈[0,1],在R上应用泰勒公式后那么存在t~∈[0,1]使得
g(1)−g(0)=∑k=1r−11k!g(k)(0)+1r!g(r)(t~)
注意g(1)=f(y),g(0)=f(x),令p(t)=x+t(y−x),那么g=f∘p并对所有的x,Dp(t)(1)=y−x,所以
g(k)(t)=Dkg(t)(1,…,1)=Dkf(p(t))(Dp(t)(1),…,Dp(t)(1))=Dkf(x+t(y−x))(y−x,…,y−x)
将上式代入前面的公式的
f(y)−f(x)=∑k=1r−11k!Dkf(x)(y−x,…,y−x)+1r!Drf(x+t~(y−x))(y−x,…,y−x)
令c=x+t~(y−x),证毕。
定理11如果f:A⊂Rn→R是可微的,A是开集,如果x0∈A是f的一个极值点,那么Df(x0)=0;即x0是一个驻点。
证明:如果Df(x0)≠0,我们可以找出x∈Rn 使得Df(x0)x=c≠0,假设c>0,那么我们可以找到δ>0使得
∥h∥<δ⇒∥f(x0+h)−f(x0)−Df(x0)h∥≤c2∥x∥∥h∥
取λ>0使得λ∥x∥<δ,那么∥f(x0+λx)−f(x0)−Df(x0)λx∥≤cλ∥x∥=cλ/2,接下来Df(x0)λx=λc,因此我们得出f(x0+λx)−f(x0)>0,同样的∥f(x0−λx)−f(x0)+Df(x0)λx≤cλ/2意味着f(x0−λx)−f(x0)<0。因为f(x0+λx)>f(x0),f(x0−λx)<f(x0),所以f(x0)不是局部极值点,即我们可以找出任意靠近x0 的点y使得f(y)>f(x0),同样的存在任意靠近x0的点y使得f(y)<f(x0)。||
定理12
- 如果f:A⊂Rn→R是定义在开集A上的C2函数,并且x0是f的驻点使得Hx0(f)是正定的,那么f在x0处有一个局部最大值。
- 如果f在x0处有一个局部最大值,那么Hx0(f)是半正定的。
证明:(i)对Rn中所有的x≠0,Hx0(f)(x,x)>0意味着对Rn中所有的x≠0,D2f(x0)(x,x)<0。 根据前面的内容可知双线性函数是连续的,因此D2f(x,x)是x的连续函数,此外S={x∈Rn|∥x∥=1}是紧集,所以存在点x¯∈S 使得对所有的x∈S,0>D2f(x0)(x¯,x¯)≥D2f(x0)(x,x)。接下来令ε=−D2f(x0)(x¯,x¯),那么对Rn 中的任意x≠0,D2f(x0)(x,x)=∥x∥2D2f(x0)(x/∥x∥,x/∥x∥)≤−ε∥x∥2。因为D2f是连续的,所以存在δ>0使得∥y−x0∥<δ 意味着∥D2f(y)−D2f(x0)∥<ε/2并且我们也可以取δ使得D(x0,δ)⊂A。如果y∈D(x0,δ),可以用泰勒定理得到f(y)−f(x0)=Df(x0)(y−x0)+(1/2)D2f(c)(y−x0,y−x0),其中c∈D(x0,δ),从而
∥D2f(c)−D2f(x0)∥<ε/2
意味着
D2f(c)(y−x0,y−x0)≤D2f(x0)(y−x0,y−x0)+∥D2f(c)(y−x0,y−x0)−D2f(x0)(y−x0,y−x0)∥≤−ε∥y−x0∥2+(ε/2)∥y−x0∥2=−(ε/2)∥y−x0∥2
因为x0是驻点,故Df(x0)=0,从而泰勒公式给出
f(y)−f(x0)=(1/2)D2f(c)(y−x0,y−x0)≤(1/2)(−ε/2∥y−x0∥2)<0
因此对所有的y∈D(x0,δ),y≠x0,f(y)<f(x0),所以f在x0 处有局部最大值。
(ii)令f在x0处有局部最大值并且假设存在x∈Rn使得D2f(x0)(x,x)>0,接下里考虑g(t)=−f(x0+tx),因为f定义在x0的邻域内,g定义在0的邻域内,从而有D2g(0)(1,1)=−D2f(x0)(x,x)<0。 利用(i)的证明,存在δ使得|t|<δ,t≠0意味着g(t)<g(0),从而|t|<δ 意味着f(x0+tx)>f(x0),所以f在x0 处没有局部最大值。这个矛盾意味着对所有的x∈Rn,D2f(x0)(x,x)≤0,因此对所有的x∈Rn,Hx0(f)(x,x)≥0。||
例1:令f:B⊂Rn→R,其中B={x∈Rn|∥x∥≤1}是连续的且令f在int(B)中可微,假设在bd(B)上,f(x)=0,说明存在点x0∈int(B)使得Df(x0)=0。
解:这是罗尔定理的多维版本。如果f恒等于零,那么该定理显然成立,因此假设存在x∈int(B)使得f(x)≠0,那么f在某个内点上得到最大值或最小值。因为B是紧集,所以存在一个极值点x0∈int(B)并且根据定理11可知Df(x0)=0。
例2:说明对双线性映射f:Rn×Rm→Rp,我们有Df(x0,y0)(x,y)=f(x0,y)+f(x,y0)(映射f(x,y)称为双线性,当它对x,y分别都是线性映射)
解:从矩阵表示中我们可以看出偏导数是存在的且连续,所以f是可微的。因为f(x,y0)是x的线性函数,在(x,0)方向的导数是Df(x0,y0)(x,0)=f(x,y0),同样的Df(x0,y0)(0,y)=f(x0,y),那么因为Df(x0,y0)是线性的且(x,y)=(x,0)+(0,y),我们有Df(x0,y0)(x,y)=f(x0,y)+f(x,y0)。
例3:求f(x,y)=(sin(xsiny),(x+y2));f:R2→R2。
解:我们有
∂f1∂x=∂∂x(sin(xsiny))=cos(xsiny)∂∂x(xsiny)=sinycos(xsiny);∂f2∂x=2(x+y)∂∂(x+y)=2(x+y);∂f1∂y=cos(xsiny)∂∂y(xsiny)=cos(xsiny)xcosy;∂f2∂y=2(x+y).
那么根据定理2,雅克比矩阵(其中x=x1,y=x2)是
(sinycos(xsiny)2(x+y)xcosycos(xsiny)2(x+y))
雅克比矩阵通常不是对称的也不一定是方阵,对称性是函数f:Rn→R二阶导数的性质。
例4:求f(x,y)=x63−3x2+y2的驻点并判断f在驻点处是否有(局部)最大值,(局部)最小值或鞍点。
解:驻点就是满足下面条件的点
∂f∂x=3x2−6x=0
与
∂f∂y=2y=0
求解
x得到
x=0,x=2,因此
f的驻点是
(0,0),(2,0)。
(x,y)处的海森矩阵是
⎛⎝⎜⎜⎜⎜−∂2f∂x∂x−∂2f∂y∂x−∂2f∂x∂y−∂2f∂y∂y⎞⎠⎟⎟⎟⎟=(−6x+600−2)
(0,0)点处的海森矩阵是
(600−2)
Δ1=+6,Δ2=−12,从而f在(0,0)处有一个鞍点,在(2,0)处海森矩阵是
(−600−2)
Δ1=−6,Δ2=12,所以f有局部最小值。
例5:令A是Rn中的开凸集,f:Rn→Rm 可微且有连续导数,假设对所有的x∈A,y∈Rn,∥Df(x)y∥≤M∥y∥,证明均值不等式:
∥f(x1)−f(x2)∥≤M∥x1−x2∥
解:对n=1,m=1从定理可以直接得出。为了得出一般情况我们处理如下,利用链式法则我们有(d/dt)f(tx1+(1−t)x2)=Df(tx1+(1−t)x2)⋅(x1−x2),两边对t从t=0到t=1进行积分得f(x1)−f(x2)=∫10Df(tx1+(1−t)x2)⋅(x1−x2)dt,取绝对值并利用Df的假设可以得出所要的结论。这里利用了事实:积分的绝对值小于等于绝对值的积分。