二次型
设
P
P
P为数域,
a
i
j
∈
P
,
i
,
j
=
1
,
2
,
⋯
,
n
a_{ij}\in P, i,j = 1,2,\cdots,n
aij∈P,i,j=1,2,⋯,n,
n
n
n个文字
x
1
,
x
2
,
⋯
,
x
n
x_1,x_2,\cdots,x_n
x1,x2,⋯,xn的二次齐次多项式
f
(
x
1
,
x
2
,
⋯
,
x
n
)
=
a
11
x
1
2
+
2
a
12
x
1
x
2
+
⋯
+
2
a
1
n
x
1
x
n
+
a
22
x
2
2
+
⋯
+
2
a
2
n
x
2
x
n
+
a
33
x
3
2
+
⋯
+
2
a
3
n
x
3
x
n
+
⋯
+
⋯
+
a
n
n
x
n
2
=
∑
i
=
1
n
∑
j
=
1
n
a
i
j
x
i
x
j
f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+2a_{12}x_1x_2+\cdots + 2a_{1n}x_1x_n + \\ a_{22}x_2^2+\cdots + 2a_{2n}x_2x_n +\\ a_{33}x_3^2+\cdots + 2a_{3n}x_3x_n +\\ \cdots+\cdots +a_{nn}x_n^2 \\ =\sum_{i=1}^n\sum_{j=1}^na_{ij}x_ix_j
f(x1,x2,⋯,xn)=a11x12+2a12x1x2+⋯+2a1nx1xn+a22x22+⋯+2a2nx2xn+a33x32+⋯+2a3nx3xn+⋯+⋯+annxn2=i=1∑nj=1∑naijxixj称为数域
P
P
P上的一个
n
n
n元二次型
约定 a i j = a j i , i < j a_{ij}=a_{ji}, i < j aij=aji,i<j,由 x i x j = x j x i x_ix_j=x_jx_i xixj=xjxi
X T A X X^TAX XTAX
矩阵 A A A称为二次型矩阵
二次型的标准形
二次型
f
(
x
1
,
x
2
,
⋯
,
x
n
)
f(x_1,x_2,\cdots,x_n)
f(x1,x2,⋯,xn),经过非退化线性替换所变成的平方和形式
d
1
y
1
2
+
d
2
y
2
2
+
⋯
+
d
n
y
n
2
d_1y_1^2+d_2y_2^2+\cdots + d_ny_n^2
d1y12+d2y22+⋯+dnyn2称为
f
(
x
1
,
x
2
,
⋯
,
x
n
)
f(x_1,x_2,\cdots,x_n)
f(x1,x2,⋯,xn)的一个标准型
配方法和合同法
实二次型 f ( x 1 , x 2 , ⋯ , x n ) f(x_1,x_2,\cdots,x_n) f(x1,x2,⋯,xn),若对任意一组不全为零的实数 c 1 , c 2 , ⋯ , c n c_1,c_2,\cdots,c_n c1,c2,⋯,cn都有 f ( c 1 , c 2 , ⋯ , c n ) > 0 f(c_1,c_2,\cdots,c_n)>0 f(c1,c2,⋯,cn)>0,则称 f f f为正定二次型
正定性的判定
实二次型
X
T
A
X
X^TAX
XTAX正定
⟺
∀
X
∈
R
n
\iff \forall X \in R^n
⟺∀X∈Rn,则
X
T
A
X
>
0
X^TAX>0
XTAX>0
设实二次型
f
(
x
1
,
x
2
,
⋯
,
x
n
)
=
d
1
x
1
2
+
d
2
x
2
2
+
⋯
+
d
n
x
n
2
f(x_1,x_2,\cdots,x_n)=d_1x_1^2+d_2x_2^2+\cdots + d_nx_n^2
f(x1,x2,⋯,xn)=d1x12+d2x22+⋯+dnxn2,
f
f
f正定,
⟺
d
i
>
0
,
i
=
1
,
2
,
⋯
,
n
\iff d_i > 0,i=1,2,\cdots,n
⟺di>0,i=1,2,⋯,n
设
A
A
A为实对称矩阵,若二次型
X
T
A
X
X^TAX
XTAX是正定的,则称
A
A
A为正定矩阵
正定矩阵的判定
实对称矩阵
A
A
A正定
⟺
A
\iff A
⟺A与单位矩阵
E
E
E合同
正定二次型的规范形为
z
1
2
+
z
2
2
+
⋯
+
z
n
2
=
Z
T
E
Z
z_1^2+z_2^2+\cdots+z_n^2=Z^TEZ
z12+z22+⋯+zn2=ZTEZ
实对称矩阵
A
A
A正定
⟺
\iff
⟺存在可逆矩阵
C
C
C,使
A
=
C
T
C
A=C^TC
A=CTC
实对称矩阵
A
A
A正定
⟺
A
\iff A
⟺A与任一正对角矩阵合同
特征值和特征向量
行列式 齐次线性方程组
A A A为 n n n阶矩阵,若数 λ \lambda λ和 n n n维非0列向量 x x x满足 A x = λ x Ax=\lambda x Ax=λx,那么数 λ \lambda λ称为 A A A的特征值, x x x称为 A A A的对应于特征值 λ \lambda λ的特征向量。并且 ∣ A − λ E ∣ |A-\lambda E| ∣A−λE∣叫做 A A A的特征多项式。当特征多项式的等于0时,称为 A A A的特征方程,特征方程是一个齐次线性方程组,求解特征值的过程其实就是求解特征方程的解;基础解系就是 x x x。
R ( A − λ E ) < n R(A-\lambda E) < n R(A−λE)<n说明, A − λ E A-\lambda E A−λE的行列式等于0
n
n
n阶方阵
A
=
(
a
i
j
)
A=(a_{ij})
A=(aij)的所有特征根
λ
1
,
λ
2
,
⋯
,
λ
n
\lambda_1,\lambda_2, \cdots,\lambda_n
λ1,λ2,⋯,λn,则有
λ
1
+
λ
2
+
⋯
+
λ
n
=
∑
i
=
1
n
a
i
i
λ
1
λ
2
⋯
λ
n
=
∣
A
∣
\lambda_1+\lambda_2+\cdots+\lambda_n=\sum_{i=1}^na_{ii} \\ \lambda_1\lambda_2\cdots\lambda_n=|A|
λ1+λ2+⋯+λn=i=1∑naiiλ1λ2⋯λn=∣A∣
韦达定理
若
λ
\lambda
λ是可逆矩阵
A
A
A的一个特征根,
x
x
x为对应的特征向量:
则
1
λ
\frac{1}{\lambda}
λ1是矩阵
A
−
1
A^{-1}
A−1的一个特征根,
x
x
x仍为对应的特征向量
则
λ
m
\lambda^m
λm是矩阵
A
m
A^m
Am的一个特征根,
x
x
x仍为对应的特征向量
设 λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2, \cdots,\lambda_n λ1,λ2,⋯,λn是方阵 A A A的互不相同的特征值, x i x_i xi是 λ i \lambda_i λi的特征向量,则 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn线性无关,即不相同的特征值的特征向量线性无关
矩阵对角化
如果一个
n
n
n阶方阵
A
A
A相似于对角矩阵,也就是,如果存在一个可逆矩阵
P
P
P使得
P
−
1
A
P
P^{-1}AP
P−1AP是对角矩阵,则称矩阵
A
A
A为可对角化矩阵。并且最终对角矩阵的特征值就是矩阵
A
A
A的特征值
P
−
1
A
P
=
Λ
P^{-1}AP=\Lambda
P−1AP=Λ
可逆矩阵
P
P
P是
A
A
A的全部特征向量按列构成的矩阵
既是上三角阵,又是下三角阵的矩阵为对角方阵或对角矩阵,主对角线不全为0,对角元的和称为方阵的迹
除对角线外的其它元素均为0的矩阵叫做对角矩阵
对于矩阵是否可以对角化,判断如下:
- 由 ∣ A − λ E ∣ = 0 ⟹ |A-\lambda E|=0 \implies ∣A−λE∣=0⟹求出所有特征值 λ i \lambda_i λi
- 如果所有的特征值都是单根,则 A A A一定能对角化
- 如果 A A A的特征值有重根,则对每个 λ i \lambda_i λi,求齐次方程组 ∣ A − λ i E ∣ X = 0 |A-\lambda_i E|X=0 ∣A−λiE∣X=0的基础解系,如果基础解系所含向量的个数等于 λ i \lambda_i λi的重根数或等于 n − R ( A − λ i E ) n-R(A-\lambda_i E) n−R(A−λiE),则 A A A可以对角化且这些基础解系排成的矩阵为相似变换矩阵
秩
设在矩阵 A A A中有一个不等于0的 r r r阶子式 D D D,且所有 r + 1 r+1 r+1阶子式(如果存在)全等于0,那么 D D D称为矩阵 A A A的最高阶非零子式, r r r称为矩阵 A A A的秩,记作 R ( A ) = r R(A)=r R(A)=r
向量组:有限个相同维数的行向量或列向量组合成的一个集合就叫做向量组
向量组是由多个向量组成,可以表示为矩阵
对于向量组
A
:
a
1
,
a
2
,
⋯
,
a
n
A:a_1,a_2,\cdots,a_n
A:a1,a2,⋯,an,
表达式
k
1
a
1
+
k
2
a
2
+
⋯
+
k
n
a
n
(
k
i
∈
R
)
k_1a_1 + k_2a_2+\cdots + k_na_n(k_i \in R)
k1a1+k2a2+⋯+knan(ki∈R)称为向量组
A
A
A的一个线性组合,
又如果
β
\beta
β是向量组
A
A
A的一个线性组合,即存在数
λ
1
,
λ
2
,
⋯
,
λ
n
\lambda_1,\lambda_2,\cdots,\lambda_n
λ1,λ2,⋯,λn,使
β
=
λ
1
a
1
+
λ
2
a
2
+
⋯
+
λ
n
a
n
\beta=\lambda_1a_1+\lambda_2a_2+\cdots+\lambda_na_n
β=λ1a1+λ2a2+⋯+λnan
则称向量
β
\beta
β可由向量组
A
A
A线性表示,通常写成
β
=
[
a
1
a
2
⋯
a
n
]
[
λ
1
λ
2
⋮
λ
n
]
\beta = \left[\begin{matrix}a_1&a_2 & \cdots & a_n \end{matrix}\right]\left[\begin{matrix}\lambda_1 \\ \lambda_2 \\ \vdots \\ \lambda_n\end{matrix}\right]
β=[a1a2⋯an]⎣⎢⎢⎢⎡λ1λ2⋮λn⎦⎥⎥⎥⎤
向量
β
\beta
β可有向量组
A
:
a
1
,
a
2
,
⋯
,
a
n
A:a_1,a_2,\cdots,a_n
A:a1,a2,⋯,an线性表示,存在数
λ
1
,
λ
2
,
⋯
,
λ
n
\lambda_1,\lambda_2,\cdots,\lambda_n
λ1,λ2,⋯,λn,使
β
=
λ
1
a
1
+
λ
2
a
2
+
⋯
+
λ
n
a
n
\beta=\lambda_1a_1+\lambda_2a_2+\cdots+\lambda_na_n
β=λ1a1+λ2a2+⋯+λnan
A
x
=
β
(
A
=
[
a
1
a
2
⋯
a
n
]
)
Ax=\beta(A = \left[\begin{matrix}a_1&a_2 & \cdots & a_n \end{matrix}\right])
Ax=β(A=[a1a2⋯an])
设向量组 A : a 1 , a 2 , ⋯ , a n A:a_1,a_2,\cdots,a_n A:a1,a2,⋯,an,如果其中一个向量可由其余的向量线性表示,则称该向量组线性相关;否则如果任一向量都不能由其余向量线性表示,则称该向量组线性无关
如果存在不全为0的数,
k
1
,
k
2
,
⋯
,
k
n
k_1,k_2,\cdots,k_n
k1,k2,⋯,kn使得
k
1
a
1
+
k
2
a
2
+
⋯
+
k
n
a
n
=
0
k_1a_1 + k_2a_2+\cdots + k_na_n=0
k1a1+k2a2+⋯+knan=0则称该向量组线性相关。
否则,如果设
k
1
a
1
+
k
2
a
2
+
⋯
+
k
n
a
n
=
0
k_1a_1 + k_2a_2+\cdots + k_na_n=0
k1a1+k2a2+⋯+knan=0只能推出
k
1
=
k
2
=
⋯
=
k
n
=
0
k_1=k_2=\cdots=k_n=0
k1=k2=⋯=kn=0,则该向量组线性无关
线性相关与线性无关统称为向量组的线性相关性
向量组
A
:
a
1
,
a
2
,
⋯
,
a
n
A:a_1,a_2,\cdots,a_n
A:a1,a2,⋯,an
线性相关的充要条件是矩阵
A
=
(
a
1
,
a
2
,
⋯
,
a
n
)
A=(a_1,a_2,\cdots,a_n)
A=(a1,a2,⋯,an)的秩小于向量个数
线性无关的充要条件是矩阵
A
=
(
a
1
,
a
2
,
⋯
,
a
n
)
A=(a_1,a_2,\cdots,a_n)
A=(a1,a2,⋯,an)的秩等于向量个数
设有
n
n
n个未知数
m
m
m个方程的线性方程组
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
b
1
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
b
2
⋮
a
m
1
x
1
+
a
m
2
x
2
+
⋯
+
a
m
n
x
n
=
b
m
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \vdots \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{cases}
⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bm
可以写成以向量
x
x
x为位置的向量方程
A
x
=
b
Ax=b
Ax=b
当
b
1
=
b
2
=
⋯
=
b
m
=
0
b_1=b_2=\cdots = b_m=0
b1=b2=⋯=bm=0时,称为齐次线性方程组,否则称为非齐次线性方程组
齐次线性方程组有解的判定:
n
n
n元齐次线性方程组
A
x
=
0
Ax=0
Ax=0有非零解的充要条件是
R
(
A
)
<
n
R(A)<n
R(A)<n
当
m
<
n
m<n
m<n时,齐次线性方程组
A
m
×
n
=
0
A_{m\times n}=0
Am×n=0一定有非零解
非齐次线性方程组有解的判定:
无解的充要条件是
R
(
A
)
<
R
(
A
,
b
)
R(A)<R(A,b)
R(A)<R(A,b)
有唯一解的充要条件是
R
(
A
)
=
R
(
A
,
b
)
=
n
R(A)=R(A,b)=n
R(A)=R(A,b)=n
有无穷多解的充要条件是
R
(
A
)
=
R
(
A
,
b
)
<
n
R(A)=R(A,b)<n
R(A)=R(A,b)<n
齐次方程组
A
m
×
n
X
=
0
A_{m\times n}X=0
Am×nX=0的基础解系所含向量个数为
n
−
r
(
r
=
R
(
A
)
)
n-r(r=R(A))
n−r(r=R(A))
设一个基础解系为:
ξ
1
,
ξ
2
,
⋯
,
ξ
n
−
r
\xi_1,\xi_2,\cdots,\xi{n-r}
ξ1,ξ2,⋯,ξn−r,则通解为
x
=
k
1
ξ
1
+
k
2
ξ
2
+
⋯
+
k
n
−
r
ξ
n
−
r
(
k
i
∈
R
)
x=k_1\xi_1+k_2\xi_2+\cdots +k_{n-r}\xi_{n-r}(k_i\in R)
x=k1ξ1+k2ξ2+⋯+kn−rξn−r(ki∈R)
基础解系不唯一,但是成比例关系
非齐次方程组解的结构定理
设
η
∗
\eta ^ *
η∗是非齐次方程组
A
m
×
n
X
=
b
A_{m\times n}X=b
Am×nX=b的一特解,则当非齐次线性方程组有无穷多解时其通解为:
x
=
k
1
ξ
1
+
k
2
ξ
2
+
⋯
+
k
n
−
r
ξ
n
−
r
+
η
∗
(
k
i
∈
R
)
x=k_1\xi_1+k_2\xi_2+\cdots +k_{n-r}\xi_{n-r}+\eta ^*(k_i\in R)
x=k1ξ1+k2ξ2+⋯+kn−rξn−r+η∗(ki∈R),
其中
x
=
k
1
ξ
1
+
k
2
ξ
2
+
⋯
+
k
n
−
r
ξ
n
−
r
x=k_1\xi_1+k_2\xi_2+\cdots +k_{n-r}\xi_{n-r}
x=k1ξ1+k2ξ2+⋯+kn−rξn−r为对应齐次线性方程组的通解
n
×
n
n\times n
n×n的可逆矩阵
A
A
A,秩为
n
n
n
可逆矩阵又称为满秩矩阵
矩阵的秩等于它行(列)向量组的秩
- 函数:定义域、值域、对应的映射法则
- 函数的几种特性:有界性、单调性、周期性、奇偶性
- 反函数:逆映射;
- 函数与其反函数关于直线 y = x y=x y=x对称;
- 若函数是单调函数,则其反函数存在,且反函数也是单调函数,且单调性相同
- 复合函数
- 极限:数列极限、函数极限
- 极限准则:夹逼准则;单调有界数列必有极限
- 两个重要极限: lim x → 0 s i n x x = 1 \lim\limits_{x\rightarrow 0}\frac{sinx}{x}=1 x→0limxsinx=1; lim x → ∞ ( 1 + 1 x ) x = e \lim\limits_{x\rightarrow \infty}(1+\frac{1}{x})^x=e x→∞lim(1+x1)x=e
- 无穷小:当 x → x 0 x\rightarrow x_0 x→x0或 x → ∞ x\rightarrow \infty x→∞时,如果函数 f ( x ) → 0 f(x)\rightarrow 0 f(x)→0,则称函数 f ( x ) f(x) f(x)为当 x → x 0 x\rightarrow x_0 x→x0或 x → ∞ x\rightarrow \infty x→∞时的无穷小
- 若 lim β α = 0 \lim\frac{\beta}{\alpha}=0 limαβ=0,则称 β \beta β是比 α \alpha α高阶的无穷小,记作 β = o ( α ) \beta=o(\alpha) β=o(α)
- 若 lim β α = 1 \lim\frac{\beta}{\alpha}=1 limαβ=1,则称 β \beta β与 α \alpha α等价无穷小
- 导数:若 lim x → x 0 f ( x ) − f ( x 0 ) x − x 0 \lim\limits_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0} x→x0limx−x0f(x)−f(x0)存在,则称函数 f ( x ) f(x) f(x)在点 x 0 x_0 x0处可导,并称此极限为该点的导数
- ( x n ) ′ = n x n − 1 (x^n)'=nx^{n-1} (xn)′=nxn−1
- ( a x ) ′ = a x l n a (a^x)'=a^xlna (ax)′=axlna
- ( e x ) ′ = e x (e^x)'=e^x (ex)′=ex
- ( l o g a x ) ′ = 1 x l n a (log_ax)'=\frac{1}{xlna} (logax)′=xlna1
- ( l n x ) ′ = 1 x (lnx)'=\frac{1}{x} (lnx)′=x1
- ( s i n x ) ′ = c o s x (sinx)'=cosx (sinx)′=cosx
- ( c o s x ) ′ = − s i n x (cosx)'=-sinx (cosx)′=−sinx
- ( u v ) ′ = u ′ v + u v ′ (uv)'=u'v+uv' (uv)′=u′v+uv′
- ( u v ) ′ = u ′ v − u v ′ v 2 (\frac{u}{v})'=\frac{u'v-uv'}{v^2} (vu)′=v2u′v−uv′
- [ f − 1 ( x ) ] ′ = 1 f ′ ( y ) [f^{-1}(x)]'=\frac{1}{f'(y)} [f−1(x)]′=f′(y)1
- 设 y = f ( u ) , u = φ ( x ) y=f(u),u=\varphi(x) y=f(u),u=φ(x),则复合函数 y = f [ φ ( x ) ] y=f[\varphi(x)] y=f[φ(x)]的导数为 d y d x = d y d u ⋅ d u d x = f ′ ( u ) ⋅ φ ′ ( x ) \frac{dy}{dx}=\frac{dy}{du}\cdot\frac{du}{dx}=f'(u)\cdot\varphi'(x) dxdy=dudy⋅dxdu=f′(u)⋅φ′(x)
- 高阶导数
- 一阶导数,函数的单调性;二阶导数,曲线的凹凸性
- 泰勒公式
- 偏导数,在一个多变量的函数中,偏导数就是关于其中一个变量的导数而保持其它变量横店不变。
- 多元函数的极值,偏导数
在
m
×
n
m\times n
m×n矩阵
A
A
A中,任取
k
k
k行
k
k
k列,不改变这
k
2
k^2
k2个元素的在
A
A
A中的次序,得到
k
k
k阶方阵,称为矩阵
A
A
A的
k
k
k阶子式。
m
×
n
m \times n
m×n阶矩阵
A
A
A的
k
k
k阶子式有
C
m
k
C
n
k
C_m^kC_n^k
CmkCnk个
误差的平方即二乘方,故称为最小二乘法
最简形矩阵,即非零行的第一个元素为1,且这些非零元所在列的其它元素都为0
方阵 A A A可逆的充要条件是经过初等变换,可以将其转换为单位变量
用初等变换,求可逆矩阵
设
A
A
A是数域上的一个
n
n
n阶方阵,若在相同的数域上存在另一个
n
n
n阶方阵
B
B
B,使得
A
B
=
B
A
=
E
AB=BA=E
AB=BA=E,那么称
B
B
B为
A
A
A的逆矩阵,而
A
A
A被称为可逆矩阵或非奇异矩阵。如果
A
A
A不存在逆矩阵,那么
A
A
A称为奇异矩阵。
A
A
A的逆矩阵记作:
A
−
1
A^{-1}
A−1
如果矩阵
A
A
A是可逆的,那么矩阵
A
A
A的逆矩阵是唯一的
矩阵
A
A
A可逆的充要条件是行列式
∣
A
∣
|A|
∣A∣不等于0
若矩阵
A
A
A可逆,则
A
B
=
A
C
=
>
B
=
C
AB=AC=>B=C
AB=AC=>B=C
A
A
A可逆,则
A
−
1
A^{-1}
A−1可逆,且
(
A
−
1
)
−
1
=
A
(A^{-1})^{-1}=A
(A−1)−1=A
线性是指量与量之间按比例成直线关系,在数学上可以理解为一阶导数为常数的函数。而非线性是指不成比例没有直线关系,一阶导数不是常数的函数。
线性代数中的基本量指的是向量,基本关系是严格的线性关系;也即是可以简单的将线性代数理解为向量与向量之间的线性关系的映射。
向量是指具有
n
n
n个互相独立的性质的对象表示,向量常使用字母箭头的形式进行表示,也可以使用几何坐标来表示向量
向量的模,向量的大小,也就是向量的长度,向量坐标到原点的距离
单位向量,指长度为一个单位的向量叫做单位向量
数量积,两个向量的数量积(内积、点积)是一个数量/实数
向量积,两个向量的向量积(外积、叉积)是一个向量
正交向量:如果两个向量的点积为0,那么称这两个向量互为正交向量;在几何意义上来讲,正交向量在二维/三维空间上其实就是两个向量垂直
如果两个或者多个向量,它们的点积均为0,那么它们互相称为正交向量
矩阵,即描述线性代数中线性关系的参数,即矩阵是一个线性变换,可以将一些向量转换为另一些向量
初等代数中,
y
=
a
x
y=ax
y=ax表示的是
x
x
x到
y
y
y的一种线性映射关系,其中
a
a
a是描述这种关系的参数
线性代数中,
Y
=
A
X
Y=AX
Y=AX表示的也是向量
X
X
X和
Y
Y
Y的一种线性映射关系,其中
A
A
A是描述这种关系的参数
当 m = 1 m=1 m=1或者 n = 1 n=1 n=1的时候,称 A A A为行向量或者列向量
对于两个矩阵
A
A
A或
B
B
B,当它们的行数相同,列数相同,并且对应位置上的元素相等时,称矩阵
A
A
A与
B
B
B相等,记做
A
=
B
A=B
A=B,即
a
i
j
=
b
i
j
a_{ij}=b_{ij}
aij=bij,对所有
i
=
1
,
2
,
.
.
.
.
.
.
m
i=1,2,......m
i=1,2,......m;
j
=
1
,
2
,
.
.
.
.
.
.
n
j=1,2,......n
j=1,2,......n都成立
若两个 矩阵行数与列数分别相等,则为同型矩阵
如果矩阵
A
A
A中
m
m
m等于
n
n
n,那么称矩阵
A
A
A为
n
n
n阶矩阵(或
n
n
n阶方阵)
从左上到右下的对角线称为主对角线
从右上到左下的对角线称为次对角线
对于矩阵 A A A(所有元素 m × n m\times n m×n),各个元素取相反数得到的矩阵称为 A A A的负矩阵,记为 − A -A −A
上三角阵,方阵,主对角线下的元素全为0
下三角阵,方阵,主对角线上的元素全为0
单位矩阵, n n n阶方阵中除了主对象线上的元素外,其它元素均为0,主对角线元素均为1,那么此时的 n n n阶方阵叫做 n n n阶单位矩阵。单位矩阵常用 E E E或者 I I I表示
如果矩阵中的所有元素均为0,那么此时矩阵叫做零矩阵,可以记作0
元素以对角线为对称轴对应相等的矩阵就叫做对称矩阵,即
A
=
A
T
A=A^T
A=AT
对称矩阵具有的特性:
对称矩阵中
a
i
j
a_{ij}
aij等于
a
j
i
a_{ji}
aji
对称矩阵一定是方阵,并且对于任何的方阵
A
A
A,
A
+
A
T
A+A^T
A+AT是对称矩阵
矩阵的转置,把矩阵
A
A
A的行和列互相交换所产生的矩阵称为
A
A
A的转置矩阵,这一过程叫做矩阵的转置,使用
A
T
A^T
AT表示
A
A
A的转置
(
A
T
)
T
=
A
(
λ
A
)
T
=
λ
A
T
(
A
+
B
)
T
=
A
T
+
B
T
(A^T)^T =A \\ (\lambda A)^T=\lambda A^T \\ (A+B)^T=A^T+B^T
(AT)T=A(λA)T=λAT(A+B)T=AT+BT
方阵的行列式,
n
n
n阶方阵
A
A
A的行列式表示为
∣
A
∣
|A|
∣A∣或者
d
e
t
(
A
)
det(A)
det(A)
1阶的方阵,其行列式等于该元素本身
2阶的行列式,主对角线元素乘积之后减去次对角线元素的乘积之和
排列的逆序数,就是这个数字之前有几位数字比它大,这个位置的逆序数就是多少
D
=
[
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋯
⋮
a
n
1
a
n
2
⋯
a
n
n
]
D=\left[\begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\cdots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\\ \end{matrix}\right]
D=⎣⎢⎢⎢⎡a11a21⋮an1a12a22⋮an2⋯⋯⋯⋯a1na2n⋮ann⎦⎥⎥⎥⎤
∑
(
−
1
)
t
a
1
q
1
a
2
q
2
⋯
a
n
q
n
∑
(
−
1
)
t
a
p
1
1
a
p
2
2
⋯
a
p
n
n
\sum(-1)^ta_{1q_1}a_{2q_2}\cdots a_{nq_n} \\ \sum(-1)^ta_{p_11}a_{p_22}\cdots a_{p_nn}
∑(−1)ta1q1a2q2⋯anqn∑(−1)tap11ap22⋯apnn
上三角行列式
D = [ a 11 a 12 ⋯ a 1 n 0 a 22 ⋯ a 2 n ⋮ ⋮ ⋯ ⋮ 0 0 ⋯ a n n ] = a 11 a 22 ⋯ a n n D=\left[\begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ 0&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\cdots&\vdots\\ 0&0&\cdots&a_{nn}\\ \end{matrix}\right] = a_{11}a_{22}\cdots a_{nn} D=⎣⎢⎢⎢⎡a110⋮0a12a22⋮0⋯⋯⋯⋯a1na2n⋮ann⎦⎥⎥⎥⎤=a11a22⋯ann
行列式的性质:
互换行列式的两行(列),行列式变号
行列式的某一行(列)中所有的元素都乘以同一数
k
k
k,等于用数
k
k
k乘此行列式
把行列数的某一行(列)各元素乘以同一数然后加到另一行(列)对应的元素上去,行列式的值不变
在一个
n
n
n阶的行列式中,把元素
a
i
j
(
i
,
j
=
1
,
2
,
3
,
.
.
.
.
.
.
,
n
)
a{ij}(i,j=1,2,3,......,n)
aij(i,j=1,2,3,......,n)所在的行和列化去后,剩下的
(
n
−
1
)
2
(n-1)^2
(n−1)2个元素按照原来的次序组成一个
n
−
1
n-1
n−1阶行列式
M
i
j
M_{ij}
Mij,称为元素
a
i
j
a_{ij}
aij的余子式。
M
i
j
M_{ij}
Mij带上符号
(
−
1
)
(
i
+
j
)
(-1)^{(i+j)}
(−1)(i+j)称为
a
i
j
a_{ij}
aij的代数余子式,记作:
A
i
j
=
(
−
1
)
(
i
+
j
)
M
i
j
A_{ij}=(-1)^{(i+j)}M_{ij}
Aij=(−1)(i+j)Mij
行列四按行(列)展开法则:
∀
1
≤
i
≤
n
,
∣
A
∣
=
∑
j
=
1
n
a
i
j
A
i
j
∀
j
≤
i
≤
n
,
∣
A
∣
=
∑
i
=
1
n
a
i
j
A
i
j
a
i
1
A
j
1
+
a
i
2
A
j
2
+
⋯
+
a
i
n
A
j
n
=
{
∣
A
∣
,
i
=
j
;
0
,
i
≠
j
.
\forall 1 \leq i \leq n,|A|=\sum_{j=1}^na_{ij}A{ij} \\ \forall j \leq i \leq n,|A|=\sum_{i=1}^na_{ij}A{ij} \\ a_{i1}A_{j1}+a_{i2}A_{j2}+ \cdots + a_{in}A_{jn} = \begin{cases} |A|,&i=j;\\ 0,&i \not = j. \end{cases}
∀1≤i≤n,∣A∣=j=1∑naijAij∀j≤i≤n,∣A∣=i=1∑naijAijai1Aj1+ai2Aj2+⋯+ainAjn={∣A∣,0,i=j;i=j.
在矩阵中有成比例的行或列,这个矩阵的行列式为0
对于
n
n
n阶方阵的任意元素
a
i
j
a_{ij}
aij都有各自的代数余子式
A
i
j
=
(
−
1
)
(
i
+
j
)
M
i
j
A_{ij}=(-1)^{(i+j)}M_{ij}
Aij=(−1)(i+j)Mij,将所有的代数余子式按照次序进行排列,可以得到一个
n
n
n阶的方阵
A
∗
A^*
A∗,那么称
A
∗
A^*
A∗称为矩阵
A
A
A的伴随矩阵
A
i
j
A_{ij}
Aij位于
A
∗
A^*
A∗的第
j
j
j行第
i
i
i列
A
⋅
A
∗
=
∣
A
∣
⋅
E
A \cdot A^* = |A| \cdot E
A⋅A∗=∣A∣⋅E
A
A
A可逆,
k
≠
0
k \not = 0
k=0,则
k
A
kA
kA可逆,且
(
k
A
)
−
1
=
1
k
A
−
1
(kA)^{-1}=\frac{1}{k}A^{-1}
(kA)−1=k1A−1
A
,
B
A,B
A,B同阶可逆,则
A
B
AB
AB可逆,且
(
A
B
)
−
1
=
B
−
1
A
−
1
(AB)^{-1}=B^{-1}A^{-1}
(AB)−1=B−1A−1
A
A
A可逆,则
A
T
A^T
AT可逆,且
(
A
T
)
−
1
=
(
A
−
1
)
T
(A^T)^{-1}=(A^{-1})^T
(AT)−1=(A−1)T
A
A
A可逆,则
∣
A
−
1
∣
=
1
∣
A
∣
|A^{-1}|=\frac{1}{|A|}
∣A−1∣=∣A∣1
A A A为 m × n m\times n m×n的矩阵, x x x为 n × 1 n \times 1 n×1的列向量,则 A x Ax Ax为 m × 1 m\times 1 m×1的列向量,记作 y ⃗ = A ⋅ x ⃗ \vec y = A \cdot \vec x y=A⋅x,则 ∂ y ⃗ ∂ x ⃗ = ∂ A x ⃗ ∂ x ⃗ = A T \frac{\partial {\vec y}}{\partial {\vec x}} = \frac{\partial A{\vec x}}{\partial {\vec x}} = A^T ∂x∂y=∂x∂Ax=AT
∂
A
x
⃗
∂
x
⃗
=
A
T
\frac{\partial A{\vec x}}{\partial {\vec x}} = A^T
∂x∂Ax=AT
∂
A
x
⃗
∂
x
⃗
T
=
A
\frac{\partial A{\vec x}}{\partial {\vec x}^T} = A
∂xT∂Ax=A
∂
x
⃗
T
A
∂
x
⃗
=
A
\frac{\partial {\vec x}^TA}{\partial {\vec x}} = A
∂x∂xTA=A
A
A
A为
n
×
n
n\times n
n×n的矩阵,
x
x
x为
n
×
1
n \times 1
n×1的列向量,记
y
=
x
⃗
T
⋅
A
⋅
x
⃗
y={\vec x}^T \cdot A \cdot \vec x
y=xT⋅A⋅x,则
∂
y
∂
x
⃗
=
∂
(
x
⃗
T
⋅
A
⋅
x
⃗
)
∂
x
⃗
=
(
A
T
+
A
)
⋅
x
⃗
\frac{\partial y}{\partial {\vec x}} = \frac{\partial({\vec x}^T \cdot A \cdot \vec x)}{\partial \vec x}=(A^T + A)\cdot\vec x
∂x∂y=∂x∂(xT⋅A⋅x)=(AT+A)⋅x
若
A
A
A为对称矩阵,则有
∂
(
x
⃗
T
A
x
⃗
)
∂
x
⃗
=
2
A
x
⃗
\frac{\partial({\vec x}^T A \vec x)}{\partial \vec x}=2A\vec x
∂x∂(xTAx)=2Ax
行向量对元素求导
设
y
T
=
[
y
1
y
2
⋯
y
n
]
y^T = \left[ \begin{matrix} y_1 & y_2 & \cdots & y_n \end{matrix} \right]
yT=[y1y2⋯yn]是
n
n
n维行向量,
x
x
x是元素,则
∂
y
T
∂
x
=
[
∂
y
1
∂
x
∂
y
2
x
⋯
∂
y
n
∂
x
]
\frac{\partial y^T}{\partial x} = \left [\begin{matrix} \frac{\partial y_1}{\partial x} & \frac{\partial y_2}{x} & \cdots & \frac{\partial y_n}{\partial x} \end{matrix} \right]
∂x∂yT=[∂x∂y1x∂y2⋯∂x∂yn]
列向量对元素求导
设
y
=
[
y
1
⋮
y
m
]
y= \left[\begin{matrix} y_1 \\ \vdots \\ y_m \end{matrix}\right]
y=⎣⎢⎡y1⋮ym⎦⎥⎤是
m
m
m维列向量,
x
x
x是元素,则
∂
y
∂
x
=
[
∂
y
1
∂
x
⋮
∂
y
m
∂
x
]
\frac{\partial y}{\partial x} = \left[\begin{matrix} \frac{\partial y_1}{\partial x} \\ \vdots \\ \frac{\partial y_m}{\partial x} \end{matrix}\right]
∂x∂y=⎣⎢⎡∂x∂y1⋮∂x∂ym⎦⎥⎤
矩阵对元素求导
设
Y
=
[
y
11
⋯
y
1
n
⋮
⋯
⋮
y
m
1
⋯
y
m
n
]
Y=\left[\begin{matrix} y_{11} & \cdots & y_{1n} \\ \vdots & \cdots & \vdots \\ y_{m1} & \cdots & y_{mn} \end{matrix}\right]
Y=⎣⎢⎡y11⋮ym1⋯⋯⋯y1n⋮ymn⎦⎥⎤是
m
×
n
m \times n
m×n矩阵,
x
x
x是元素,则
∂
Y
∂
x
=
[
∂
y
11
∂
x
⋯
∂
y
1
m
∂
x
⋮
⋯
⋮
∂
y
m
1
∂
x
⋯
∂
y
m
n
∂
x
]
\frac{\partial Y}{\partial x}=\left[\begin{matrix} \frac{\partial y_{11}}{\partial x} & \cdots & \frac{\partial y_{1m}}{\partial x} \\ \vdots & \cdots & \vdots \\ \frac{\partial y_{m1}}{\partial x} & \cdots & \frac{\partial y_{mn}}{\partial x} \end{matrix}\right]
∂x∂Y=⎣⎢⎡∂x∂y11⋮∂x∂ym1⋯⋯⋯∂x∂y1m⋮∂x∂ymn⎦⎥⎤
元素对行向量求导
设
y
y
y是元素,
x
T
=
[
x
1
⋯
x
q
]
x^T=\left[\begin{matrix} x_1 & \cdots & x_q\end{matrix}\right]
xT=[x1⋯xq]是
q
q
q维行向量,则
∂
y
∂
x
T
[
∂
y
∂
x
1
⋯
∂
y
∂
x
q
]
\frac{\partial y}{\partial x^T} \left[\begin{matrix} \frac{\partial y}{\partial x_1} & \cdots & \frac{\partial y}{\partial x_q} \end{matrix}\right]
∂xT∂y[∂x1∂y⋯∂xq∂y]
元素对列向量求导
设
y
y
y是元素,
x
=
[
x
1
⋮
x
p
]
x=\left[\begin{matrix} x_1 \\ \vdots \\ x_p\end{matrix}\right]
x=⎣⎢⎡x1⋮xp⎦⎥⎤是
p
p
p维列向量,则
∂
y
∂
x
=
[
∂
y
∂
x
1
⋮
∂
y
∂
x
p
]
\frac{\partial y}{\partial x } = \left[\begin{matrix} \frac{\partial y}{\partial x_1} \\ \vdots \\ \frac{\partial y}{\partial x_p} \end{matrix}\right]
∂x∂y=⎣⎢⎢⎡∂x1∂y⋮∂xp∂y⎦⎥⎥⎤
元素对矩阵求导
设
y
y
y是元素,
X
=
[
x
11
⋯
x
1
q
⋮
⋯
⋮
x
p
1
⋯
x
p
q
]
X=\left[\begin{matrix} x_{11} & \cdots & x_{1q} \\ \vdots & \cdots & \vdots \\ x_{p1} & \cdots & x_{pq} \end{matrix}\right]
X=⎣⎢⎡x11⋮xp1⋯⋯⋯x1q⋮xpq⎦⎥⎤是
p
×
q
p\times q
p×q矩阵,则
∂
y
∂
X
=
[
∂
y
∂
x
11
⋯
∂
y
∂
x
1
q
⋮
⋯
⋮
∂
y
∂
x
p
1
⋯
∂
y
∂
x
p
q
]
\frac{\partial y}{\partial X}=\left[\begin{matrix} \frac{\partial y}{\partial x_{11}} & \cdots & \frac{\partial y}{\partial x_{1q}} \\ \vdots & \cdots & \vdots \\ \frac{\partial y}{\partial x_{p1}} & \cdots & \frac{\partial y}{\partial x_{pq}} \end{matrix}\right]
∂X∂y=⎣⎢⎢⎡∂x11∂y⋮∂xp1∂y⋯⋯⋯∂x1q∂y⋮∂xpq∂y⎦⎥⎥⎤
行向量对列向量求导
设
y
T
=
[
y
1
⋯
y
n
]
y^T=\left[\begin{matrix} y_1 & \cdots & y_n\end{matrix}\right]
yT=[y1⋯yn]是
n
n
n维行向量,
x
=
[
x
1
⋮
x
p
]
x=\left[\begin{matrix} x_1 \\ \vdots \\ x_p\end{matrix}\right]
x=⎣⎢⎡x1⋮xp⎦⎥⎤是
p
p
p维向量,则
∂
y
T
∂
x
=
[
∂
y
1
∂
x
1
⋯
∂
y
n
∂
x
1
⋮
⋯
⋮
∂
y
n
∂
x
p
⋯
∂
y
n
∂
x
p
]
\frac{\partial y_T}{\partial x} = \left[\begin{matrix} \frac{\partial y_1}{\partial x_1} & \cdots & \frac{\partial y_n}{\partial x_1} \\ \vdots & \cdots & \vdots\\ \frac{\partial y_n}{\partial x_p} & \cdots & \frac{\partial y_n}{\partial x_p} \end{matrix}\right]
∂x∂yT=⎣⎢⎢⎡∂x1∂y1⋮∂xp∂yn⋯⋯⋯∂x1∂yn⋮∂xp∂yn⎦⎥⎥⎤
列向量对行向量求导
设
y
=
[
y
1
⋮
y
m
]
y=\left[\begin{matrix} y_1 \\ \vdots \\ y_m\end{matrix}\right]
y=⎣⎢⎡y1⋮ym⎦⎥⎤是
m
m
m维列向量,
x
T
=
[
x
1
⋯
x
q
]
x^T=\left[\begin{matrix}x_1 & \cdots & x_q\end{matrix}\right]
xT=[x1⋯xq]是
q
q
q维行向量,则
∂
y
∂
x
T
=
[
∂
y
1
∂
x
1
⋯
∂
y
1
∂
x
q
⋮
⋯
⋮
∂
y
m
∂
x
1
⋯
∂
y
m
∂
x
q
]
\frac{\partial y}{\partial x^T}=\left[\begin{matrix} \frac{\partial y_1}{\partial x_1} & \cdots & \frac{\partial y_1}{\partial x_q} \\ \vdots & \cdots & \vdots \\ \frac{\partial y_m}{\partial x_1} & \cdots & \frac{\partial y_m}{\partial x_q} \end{matrix}\right]
∂xT∂y=⎣⎢⎢⎡∂x1∂y1⋮∂x1∂ym⋯⋯⋯∂xq∂y1⋮∂xq∂ym⎦⎥⎥⎤
行向量对行向量求导
设 y T = [ y 1 ⋯ y n ] y^T=\left[\begin{matrix} y_1 & \cdots & y_n\end{matrix}\right] yT=[y1⋯yn]是 n n n维行向量, x T = [ x 1 ⋯ x q ] x^T=\left[\begin{matrix}x_1 & \cdots & x_q\end{matrix}\right] xT=[x1⋯xq]是 q q q维行向量,将 y T y^T yT转换为列向量进行求导,转换的是分子部分
列向量对列向量求导
设 y = [ y 1 ⋮ y m ] y=\left[\begin{matrix} y_1 \\ \vdots \\ y_m\end{matrix}\right] y=⎣⎢⎡y1⋮ym⎦⎥⎤是 m m m维列向量, x = [ x 1 ⋮ x p ] x=\left[\begin{matrix} x_1 \\ \vdots \\ x_p\end{matrix}\right] x=⎣⎢⎡x1⋮xp⎦⎥⎤是 p p p维向量,将 y y y转换为行向量进行求导,转换的是分子部分
矩阵对行向量求导
矩阵对列向量求导
通过函数导数的值,可以判断出函数的单调性和曲线的凹凸性
若一阶导数大于0,则单调递增;若一阶导数小于0,则单调递减;导数等于0的点,为函数的驻点
若二阶导数大于0,则曲线是凹的;若二阶导数小于0,则曲线是凸的。曲线上凹凸性改变的点,称为曲线的拐点
如果函数的导函数在某一个区间内恒大于0(或恒小于0),那么函数在这个区间单调递增(或单调递减),这种区间叫做单调区间;如果函数的二阶导函数在某一个区间内恒大于0(或恒小于0),那么曲线在这个区间是凹的(或凸的),这种区间叫做凹凸区间。
设函数
y
=
f
(
x
)
y=f(x)
y=f(x)在
[
a
,
b
]
[a,b]
[a,b]上连续,在(a,b)内可导。
如果在
(
a
,
b
)
(a,b)
(a,b)内
f
′
(
x
)
>
0
f'(x)>0
f′(x)>0,那么函数
y
=
f
(
x
)
y=f(x)
y=f(x)在
[
a
,
b
]
[a,b]
[a,b]上单调增加
如果在
(
a
,
b
)
(a,b)
(a,b)内
f
′
(
x
)
<
0
f'(x)<0
f′(x)<0,那么函数
y
=
f
(
x
)
y=f(x)
y=f(x)在
[
a
,
b
]
[a,b]
[a,b]上单调减少
设函数
f
(
x
)
f(x)
f(x)在区间
I
I
I上连续,
∀
x
1
,
x
2
∈
I
\forall x_1,x_2 \in I
∀x1,x2∈I,若恒有
f
(
x
1
+
x
2
x
)
<
f
(
x
1
)
+
f
(
x
2
)
2
f(\frac{x_1+x_2}{x})<\frac{f(x_1)+f(x_2)}{2}
f(xx1+x2)<2f(x1)+f(x2),则称
f
(
x
)
f(x)
f(x)的图形是凹的
若恒有
f
(
x
1
+
x
2
x
)
>
f
(
x
1
)
+
f
(
x
2
)
2
f(\frac{x_1+x_2}{x})>\frac{f(x_1)+f(x_2)}{2}
f(xx1+x2)>2f(x1)+f(x2),则称
f
(
x
)
f(x)
f(x)的图形是凸的
连接曲线上的凸弧与凹弧的分界点,称为曲线的拐点
设函数
f
(
x
)
f(x)
f(x)在区间
I
I
I上有二阶导数,
在
I
I
I内
f
′
′
(
x
)
>
0
f''(x)>0
f′′(x)>0,则f(x)内的图形是凹的
在
I
I
I内
f
′
′
(
x
)
<
0
f''(x)<0
f′′(x)<0,则f(x)内的图形是凸的
设函数
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
0
x_0
x0的某领域内有定义,若
lim
x
→
x
0
f
(
x
)
−
f
(
x
0
)
x
−
x
0
=
lim
Δ
x
→
0
Δ
y
Δ
x
\lim\limits_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0}=\lim\limits_{\Delta x \rightarrow 0}\frac{\Delta y}{\Delta x}
x→x0limx−x0f(x)−f(x0)=Δx→0limΔxΔy存在,其中
Δ
y
=
f
(
x
)
−
f
(
x
0
)
Δ
x
=
x
−
x
0
\Delta y = f(x)-f(x_0) \Delta x = x - x_0
Δy=f(x)−f(x0)Δx=x−x0。则称函数
f
(
x
)
f(x)
f(x)在点
x
0
x_0
x0处可导,并称此极限为
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
0
x_0
x0的导数,记作:
y
′
∣
x
=
x
0
y'|_{x=x_0}
y′∣x=x0
f
′
(
x
0
)
f'(x_0)
f′(x0)
d
y
d
x
∣
x
=
x
0
\frac{dy}{dx}|_{x=x_0}
dxdy∣x=x0
d
f
(
x
)
d
x
∣
x
=
x
0
\frac{df(x)}{dx}|_{x=x_0}
dxdf(x)∣x=x0
即
y
′
∣
x
=
x
0
=
f
′
(
x
0
)
=
lim
Δ
x
→
0
Δ
y
Δ
x
=
lim
x
→
x
0
f
(
x
)
−
f
(
x
0
)
x
−
x
0
y'|_{x=x_0}=f'(x_0)=\lim\limits_{\Delta x \rightarrow 0}\frac{\Delta y}{\Delta x}=\lim\limits_{x\rightarrow x_0}\frac{f(x)-f(x_0)}{x-x_0}
y′∣x=x0=f′(x0)=Δx→0limΔxΔy=x→x0limx−x0f(x)−f(x0)
常用函数的导数公式:
(
C
)
′
=
0
(C)'=0
(C)′=0
(
s
i
n
x
)
′
=
c
o
s
x
(sinx)'=cosx
(sinx)′=cosx
(
c
o
s
x
)
′
=
−
s
i
n
x
(cosx)'= -sinx
(cosx)′=−sinx
(
x
u
)
′
=
u
x
u
−
1
(x^u)' = ux^{u-1}
(xu)′=uxu−1
(
a
x
)
′
=
a
x
l
n
a
(a^x)'=a^xlna
(ax)′=axlna
(
e
x
)
′
=
e
x
(e^x)'=e^x
(ex)′=ex
(
l
o
g
a
x
)
′
=
1
x
l
n
a
(log_ax)'=\frac{1}{xlna}
(logax)′=xlna1
(
l
n
x
)
′
=
1
x
(lnx)'=\frac{1}{x}
(lnx)′=x1
多元函数
设
D
D
D是平面上的一个点集,如果对于每一个点
p
(
x
,
y
)
∈
D
p(x,y) \in D
p(x,y)∈D,变量
z
z
z按照一定的法则总是有确定的值和它对应,则称
z
z
z是变量
x
,
y
x,y
x,y的二元函数,记为
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)或记为
z
=
f
(
P
)
z=f(P)
z=f(P)
设函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)的定义域为
D
D
D,对于任意取定的
P
(
x
,
y
)
∈
D
P(x,y) \in D
P(x,y)∈D,对应的函数值为
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y),这样,以
x
x
x为横坐标,
y
y
y为纵轴标,
z
z
z为竖坐标在空间就确定一点
M
(
x
,
y
,
z
)
M(x,y,z)
M(x,y,z),取
(
x
,
y
)
(x,y)
(x,y)遍
D
D
D上的一切点时,得一个空间集
{
(
x
,
y
,
z
)
∣
z
=
f
(
x
,
y
)
,
(
x
,
y
)
∈
D
}
{\{(x,y,z)|z=f(x,y), (x,y) \in D\}}
{(x,y,z)∣z=f(x,y),(x,y)∈D}
这个点集称为二元函数的图形
多元函数中同样有定义域、值域、自变量、因变量等概念
多元函数的偏导数
在一个多变量的函数中,偏导数就是关于其中一个变量的导数而保持其它变量恒定不变。假定二元函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y),点
(
x
0
,
y
0
)
(x_0,y_0)
(x0,y0)是其定义域内的一个点,将
y
y
y固定在
y
0
y_0
y0上,而
x
x
x在
x
0
x_0
x0上增量
Δ
x
\Delta x
Δx,相应的函数
z
z
z有增量
Δ
z
=
f
(
x
0
+
Δ
x
,
y
0
)
−
f
(
x
0
,
y
0
)
\Delta z=f(x_0+\Delta x,y_0)-f(x_0,y_0)
Δz=f(x0+Δx,y0)−f(x0,y0);
Δ
z
\Delta z
Δz和
Δ
x
\Delta x
Δx的比值当
Δ
x
\Delta x
Δx趋近于0的时候,如果极限存在,那么此极限值称为函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y),在
(
x
0
,
y
0
)
(x_0,y_0)
(x0,y0)处对
x
x
x的偏导数,记作
f
x
(
x
0
,
y
0
)
f_x(x_0,y_0)
fx(x0,y0),对
x
x
x的偏导数
∂
f
∂
x
\frac{\partial f}{\partial x}
∂x∂f,对
y
y
y的偏导数
∂
f
∂
y
\frac{\partial f}{\partial y}
∂y∂f
f
x
(
x
0
,
y
0
,
z
0
)
=
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
,
y
0
,
z
0
)
−
f
(
x
0
,
y
0
,
z
0
)
Δ
x
f_x(x_0,y_0,z_0)=\lim\limits_{\Delta x \rightarrow 0}\frac{f(x_0+\Delta x,y_0,z_0)-f(x_0,y_0,z_0)}{{\Delta x}}
fx(x0,y0,z0)=Δx→0limΔxf(x0+Δx,y0,z0)−f(x0,y0,z0)
f
y
(
x
0
,
y
0
,
z
0
)
=
lim
Δ
x
→
0
f
(
x
0
,
y
0
+
Δ
y
,
z
0
)
−
f
(
x
0
,
y
0
,
z
0
)
Δ
y
f_y(x_0,y_0,z_0)=\lim\limits_{\Delta x \rightarrow 0}\frac{f(x_0,y_0+\Delta y,z_0)-f(x_0,y_0,z_0)}{{\Delta y}}
fy(x0,y0,z0)=Δx→0limΔyf(x0,y0+Δy,z0)−f(x0,y0,z0)
f
z
(
x
0
,
y
0
,
z
0
)
=
lim
Δ
x
→
0
f
(
x
0
,
y
0
,
z
0
+
Δ
z
)
−
f
(
x
0
,
y
0
,
z
0
)
Δ
z
f_z(x_0,y_0,z_0)=\lim\limits_{\Delta x \rightarrow 0}\frac{f(x_0,y_0,z_0 + \Delta z)-f(x_0,y_0,z_0)}{{\Delta z}}
fz(x0,y0,z0)=Δx→0limΔzf(x0,y0,z0+Δz)−f(x0,y0,z0)
拉格朗日乘数法
要找函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在条件
φ
(
x
,
y
)
=
0
\varphi(x,y)=0
φ(x,y)=0下的可能极值点,引入拉格朗日函数
F
(
x
,
y
,
λ
)
=
f
(
x
,
y
)
+
λ
φ
(
x
,
y
)
F(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y)
F(x,y,λ)=f(x,y)+λφ(x,y)
其中
λ
\lambda
λ为参数,
{
f
x
′
(
x
,
y
)
+
λ
φ
x
′
(
x
,
y
)
=
0
f
y
′
(
x
,
y
)
+
λ
φ
y
′
(
x
,
y
)
=
0
φ
(
x
,
y
)
=
0
\begin{cases} f'_x(x,y)+\lambda\varphi'_x(x,y)=0\\ f'_y(x,y)+\lambda\varphi'_y(x,y)=0\\ \varphi(x,y)=0 \end{cases}
⎩⎪⎨⎪⎧fx′(x,y)+λφx′(x,y)=0fy′(x,y)+λφy′(x,y)=0φ(x,y)=0
解出
x
,
y
,
λ
x,y,\lambda
x,y,λ,其中
x
,
y
x,y
x,y就是可能的极值点的坐标
方向导数
若函数
f
(
x
,
y
,
z
)
f(x,y,z)
f(x,y,z)在点
P
(
x
,
y
,
z
)
P(x,y,z)
P(x,y,z)处沿方向
I
I
I(方向角为
α
,
β
,
γ
\alpha,\beta,\gamma
α,β,γ)存在下列极限:
lim
ρ
→
0
Δ
f
ρ
=
lim
ρ
→
0
f
(
x
+
Δ
x
,
y
+
Δ
y
,
z
+
Δ
z
)
−
f
(
x
,
y
,
z
)
ρ
\lim\limits_{\rho \rightarrow 0}\frac{\Delta f}{\rho}=\lim\limits_{\rho \rightarrow 0} \frac{f(x+\Delta x,y+ \Delta y, z+ \Delta z)-f(x,y,z)}{\rho}
ρ→0limρΔf=ρ→0limρf(x+Δx,y+Δy,z+Δz)−f(x,y,z)
ρ
=
∣
Δ
l
⃗
∣
=
(
Δ
x
)
2
+
(
Δ
y
)
2
+
(
Δ
z
)
2
\rho=|\vec{\Delta l}| = \sqrt{(\Delta x)^2 + (\Delta y)^2 + (\Delta z)^2}
ρ=∣Δl∣=(Δx)2+(Δy)2+(Δz)2
Δ x = ρ c o s α Δ y = ρ c o s β Δ z = ρ c o s γ \Delta x = \rho cos\alpha \\ \Delta y = \rho cos\beta \\ \Delta z = \rho cos\gamma Δx=ρcosαΔy=ρcosβΔz=ρcosγ
若函数
f
(
x
,
y
,
z
)
f(x,y,z)
f(x,y,z)在点
P
(
x
,
y
,
z
)
P(x,y,z)
P(x,y,z)处可微,则:
∂
f
∂
l
=
∂
f
∂
x
c
o
s
α
+
∂
f
∂
y
c
o
s
β
+
∂
f
∂
z
c
o
s
γ
\frac{\partial f}{\partial l} = \frac{\partial f}{\partial x}cos\alpha + \frac{\partial f}{\partial y}cos\beta + \frac{\partial f}{\partial z}cos\gamma
∂l∂f=∂x∂fcosα+∂y∂fcosβ+∂z∂fcosγ
其中,
α
,
β
,
γ
\alpha,\beta,\gamma
α,β,γ为
l
l
l的方向角
令向量:
G
⃗
=
(
∂
f
∂
x
,
∂
f
∂
y
,
∂
f
∂
z
)
l
⃗
0
=
(
c
o
s
α
,
c
o
s
β
,
c
o
s
γ
)
∂
f
∂
l
=
G
⃗
⋅
l
⃗
0
=
∣
G
⃗
∣
∣
l
⃗
0
∣
c
o
s
(
)
∣
l
⃗
0
∣
=
1
∂
f
∂
l
=
G
⃗
⋅
l
⃗
0
=
∣
G
⃗
∣
c
o
s
(
)
\vec G = (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y},\frac{\partial f}{\partial z})\\ \vec l^0 = (cos\alpha,cos\beta,cos\gamma)\\ \frac{\partial f}{\partial l} = \vec G \cdot \vec l^0 = |\vec G||\vec l^0|cos()\\ |\vec l^0|=1 \frac{\partial f}{\partial l} = \vec G \cdot \vec l^0 = |\vec G|cos()\\
G=(∂x∂f,∂y∂f,∂z∂f)l0=(cosα,cosβ,cosγ)∂l∂f=G⋅l0=∣G∣∣l0∣cos()∣l0∣=1∂l∂f=G⋅l0=∣G∣cos()
当
G
⃗
\vec G
G与
l
⃗
0
\vec l^0
l0方向一致时,方向导数取最大值:
m
a
x
(
∂
f
∂
l
)
=
∣
G
⃗
∣
max(\frac{\partial f}{\partial l}) = |\vec G|
max(∂l∂f)=∣G∣
这说明,
G
⃗
\vec G
G的方向是
f
f
f变化率的最大方向,
G
⃗
\vec G
G的模是
f
f
f的最大变化率的值
向量
G
⃗
\vec G
G称为函数
f
(
P
)
f(P)
f(P)在点
P
P
P处的梯度,记作
g
r
a
n
d
f
grand f
grandf,即
g
r
a
n
d
f
=
∂
f
∂
x
i
⃗
+
∂
f
∂
y
j
⃗
+
∂
f
∂
z
k
⃗
=
(
∂
f
∂
x
,
∂
f
∂
y
,
∂
f
∂
z
)
grand~~ f = \frac{\partial f}{\partial x}\vec i + \frac{\partial f}{\partial y}\vec j + \frac{\partial f}{\partial z}\vec k = (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y},\frac{\partial f}{\partial z})
grand f=∂x∂fi+∂y∂fj+∂z∂fk=(∂x∂f,∂y∂f,∂z∂f)
梯度
梯度就是方向导数中所沿的方向
二元函数
f
(
x
,
y
)
f(x,y)
f(x,y)在点
P
(
x
,
y
)
P(x,y)
P(x,y)处的梯度
g
r
a
n
d
f
=
∂
f
∂
x
i
⃗
+
∂
f
∂
y
j
⃗
=
(
∂
f
∂
x
,
∂
f
∂
y
)
grand~~f=\frac{\partial f}{\partial x}\vec i + \frac{\partial f}{\partial y}\vec j = (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y})
grand f=∂x∂fi+∂y∂fj=(∂x∂f,∂y∂f)
引用记号
∇
=
(
∂
f
∂
x
,
∂
f
∂
y
)
\nabla = (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y})
∇=(∂x∂f,∂y∂f),称为奈布拉算符,或称为向量微分算子或哈密顿算子,则梯度可记为
g
r
a
n
d
f
=
(
∂
f
∂
x
,
∂
f
∂
y
)
=
∇
f
grand~~f = (\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}) = \nabla f
grand f=(∂x∂f,∂y∂f)=∇f
函数
f
f
f沿梯度
g
r
a
n
d
f
grand ~~ f
grand f方向增加最快
函数
f
f
f沿梯度
−
g
r
a
n
d
f
-grand ~~ f
−grand f方向减小最快
泰勒公式最开始的目的是尽可能的近似的求出复杂函数值的值
f ( x ) = f ( x 0 ) 0 ! + f ′ ( x 0 ) 1 ! ( x − x 0 ) + f ′ ′ ( x 0 ) 2 ! ( x − x 0 ) 2 + . . . . . . + f ( n ) ( x 0 ) n ! ( x − x 0 ) n + R n ( x ) f(x)=\frac{f(x_0)}{0!} + \frac{f'(x_0)}{1!}(x-x_0) + \frac{f''(x_0)}{2!}(x-x_0)^{2} + ...... + \frac{f^{(n)}(x_0)}{n!}(x-x_0)^n + R_n(x) f(x)=0!f(x0)+1!f′(x0)(x−x0)+2!f′′(x0)(x−x0)2+......+n!f(n)(x0)(x−x0)n+Rn(x)
R n ( x ) R_n(x) Rn(x)是泰勒公式的余项,是 ( x − x 0 ) n (x-x_0)^n (x−x0)n的高阶无穷小
当 x → x 0 x{\rightarrow} x_0 x→x0或 x → ∞ x{\rightarrow} \infty x→∞时,如果函数 f ( x ) → 0 f(x)\rightarrow 0 f(x)→0,则称函数 f ( x ) f(x) f(x)为当 x → x 0 x\rightarrow x_0 x→x0或 x → ∞ x \rightarrow \infty x→∞时的无穷小
若 l i m β α = 0 lim\frac{\beta}{\alpha}=0 limαβ=0,则称 β \beta β是比 α \alpha α的高阶无穷小,记作 β = o ( α ) \beta=o(\alpha) β=o(α)
麦克劳林公式,即
x
0
=
0
x_0=0
x0=0
f
(
x
)
=
f
(
0
)
0
!
+
f
′
(
0
)
1
!
x
+
f
′
′
(
0
)
2
!
x
2
+
.
.
.
.
.
.
+
f
(
n
)
(
0
)
n
!
x
n
+
R
n
(
x
)
f(x)=\frac{f(0)}{0!} + \frac{f'(0)}{1!}x + \frac{f''(0)}{2!}x^2 + ...... + \frac{f^{(n)}(0)}{n!}x^n + R_n(x)
f(x)=0!f(0)+1!f′(0)x+2!f′′(0)x2+......+n!f(n)(0)xn+Rn(x)