目录
文章目录
作业概览
![]() | ![]() |
---|---|
![]() | ![]() |
证明题1解答
(5.2.9)的证明如下:
使用CBS不等式可得:
∣
y
∗
A
x
∣
≤
∥
y
∥
2
∥
A
x
∥
2
⟹
max
∥
x
∥
∥
2
=
1
∥
y
∥
2
=
1
∣
y
∗
A
x
∣
≤
max
∥
x
∥
2
=
1
∥
A
x
∥
2
=
∥
A
∥
2
\left|\mathbf{y}^* \mathbf{A} \mathbf{x}\right| \leq\|\mathbf{y}\|_2\|\mathbf{A x}\|_2 \Longrightarrow \max _{\substack{\|\mathbf{x} \|\left\|_2=1\\\right\| \mathbf{y} \|_2=1}}\left|\mathbf{y}^* \mathbf{A x}\right| \leq \max _{\|\mathbf{x}\|_2=1}\|\mathbf{A} \mathbf{x}\|_2=\|\mathbf{A}\|_2
∣y∗Ax∣≤∥y∥2∥Ax∥2⟹∥x∥∥2=1∥y∥2=1max∣y∗Ax∣≤∥x∥2=1max∥Ax∥2=∥A∥2
然后证明在二维单位球面上的
x
\mathbf{x}
x和
y
\mathbf{y}
y对实际上能取到等式。若
x
0
\mathbf{x}_0
x0是一个单位长度的向量则:
∥
A
x
0
∥
2
=
max
∥
x
∥
2
=
1
∥
A
x
∥
2
=
∥
A
∥
2
\left\|\mathbf{A} \mathbf{x}_0\right\|_2=\max _{\|\mathbf{x}\|_2=1}\|\mathbf{A} \mathbf{x}\|_2=\|\mathbf{A}\|_2
∥Ax0∥2=∥x∥2=1max∥Ax∥2=∥A∥2
如果
y
0
=
A
x
0
∥
A
x
0
∥
2
=
A
x
0
∥
A
∥
2
\mathbf{y}_0=\frac{\mathbf{A} \mathbf{x}_0}{\left\|\mathbf{A} \mathbf{x}_0\right\|_2}=\frac{\mathbf{A} \mathbf{x}_0}{\|\mathbf{A}\|_2}
y0=∥Ax0∥2Ax0=∥A∥2Ax0,可得
y
0
∗
A
x
0
=
x
0
∗
A
∗
A
x
0
∥
A
∥
2
=
∥
A
x
0
∥
2
2
∥
A
∥
2
=
∥
A
∥
2
2
∥
A
∥
2
=
∥
A
∥
2
\mathbf{y}_0^* \mathbf{A} \mathbf{x}_0=\frac{\mathbf{x}_0^* \mathbf{A}^* \mathbf{A} \mathbf{x}_0}{\|\mathbf{A}\|_2}=\frac{\left\|\mathbf{A} \mathbf{x}_0\right\|_2^2}{\|\mathbf{A}\|_2}=\frac{\|\mathbf{A}\|_2^2}{\|\mathbf{A}\|_2}=\|\mathbf{A}\|_2
y0∗Ax0=∥A∥2x0∗A∗Ax0=∥A∥2∥Ax0∥22=∥A∥2∥A∥22=∥A∥2,则得证。
(5.2.10)的证明如下:
由(a)可直接推出:
∥
A
∥
2
=
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
y
∗
A
x
∣
=
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
(
y
∗
A
x
)
∗
∣
=
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
x
∗
A
∗
y
∣
=
∥
A
∗
∥
2
\|\mathbf{A}\|_2=\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y} \|_2=1}}\left|\mathbf{y}^* \mathbf{A x}\right|=\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y}\|_2=1}}\left|\left(\mathbf{y}^* \mathbf{A} \mathbf{x}\right)^*\right|=\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y}\|_2=1}}\left|\mathbf{x}^* \mathbf{A}^* \mathbf{y}\right|=\left\|\mathbf{A}^*\right\|_2
∥A∥2=∥x∥2=1∥y∥2=1max∣y∗Ax∣=∥x∥2=1∥y∥2=1max
(y∗Ax)∗
=∥x∥2=1∥y∥2=1max∣x∗A∗y∣=∥A∗∥2
(5.2.11)的证明如下:
由(a)的结论
∥
A
∥
2
=
max
∥
x
∥
2
=
1
max
∥
y
∥
2
=
1
∣
y
∗
A
x
∣
\|\mathbf{A}\|_2=\max _{\|\mathbf{x}\|_2=1} \max _{\|\mathbf{y}\|_2=1}\left|\mathbf{y}^* \mathbf{A x}\right|
∥A∥2=max∥x∥2=1max∥y∥2=1∣y∗Ax∣可知:
∥
A
∗
A
∥
2
=
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
y
∗
A
∗
A
x
∣
\left\|\mathbf{A}^* \mathbf{A}\right\|_2=\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y} \|_2=1}}\left|\mathbf{y}^* \mathbf{A}^* \mathbf{A x}\right|
∥A∗A∥2=∥x∥2=1∥y∥2=1max∣y∗A∗Ax∣
利用CBS不等式可知:
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
y
∗
A
∗
A
x
∣
≤
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∥
A
y
∥
2
∥
A
x
∥
2
\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y} \|_2=1}}\left|\mathbf{y}^* \mathbf{A}^* \mathbf{A x}\right| \leq \max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y} \|_2=1}}\|\mathbf{A y}\|_2\|\mathbf{A x}\|_2
∥x∥2=1∥y∥2=1max∣y∗A∗Ax∣≤∥x∥2=1∥y∥2=1max∥Ay∥2∥Ax∥2
故综上可以给出推导过程:
∥
A
∗
A
∥
2
=
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∣
y
∗
A
∗
A
x
∣
≤
max
∥
x
∥
2
=
1
∥
y
∥
2
=
1
∥
A
y
∥
2
∥
A
x
∥
2
=
∥
A
∥
2
2
\left\|\mathbf{A}^* \mathbf{A}\right\|_2=\max _{\substack{\|\mathbf{x} \|_2=1 \\\|\mathbf{y}\|_2=1}}\left|\mathbf{y}^* \mathbf{A}^* \mathbf{A} \mathbf{x}\right| \leq \max _{\substack{\|\mathbf{x}\|_2=1 \\\|\mathbf{y}\|_2=1}}\|\mathbf{A} \mathbf{y}\|_2\|\mathbf{A} \mathbf{x}\|_2=\|\mathbf{A}\|_2^2
∥A∗A∥2=∥x∥2=1∥y∥2=1max∣y∗A∗Ax∣≤∥x∥2=1∥y∥2=1max∥Ay∥2∥Ax∥2=∥A∥22
(5.2.12)的证明如下:
令
D
=
(
A
0
0
B
)
\mathbf{D}=\left(\begin{array}{cc}\mathbf{A} & \mathbf{0} \\ \mathbf{0} & \mathrm{B}\end{array}\right)
D=(A00B),由(5.2.7)可知
∥
D
∥
2
2
\|\mathbf{D}\|_2^2
∥D∥22是最大值
λ
\lambda
λ,故可推得
D
T
D
−
λ
I
\mathbf{D}^T \mathbf{D}-\lambda \mathbf{I}
DTD−λI是奇异的。但是当且仅当
A
T
A
−
λ
I
\mathbf{A}^T \mathbf{A}-\lambda \mathbf{I}
ATA−λI or
B
T
B
−
λ
I
\mathbf{B}^T \mathbf{B}-\lambda \mathbf{I}
BTB−λI是奇异的时,
D
T
D
−
λ
I
\mathbf{D}^T \mathbf{D}-\lambda \mathbf{I}
DTD−λI是奇异的,故:
λ
max
(
D
)
=
max
{
λ
max
(
A
)
,
λ
max
(
B
)
}
\lambda_{\max }(\mathbf{D})=\max \left\{\lambda_{\max }(\mathbf{A}), \lambda_{\max }(\mathbf{B})\right\}
λmax(D)=max{λmax(A),λmax(B)}
可知:
∥
(
A
0
0
B
)
∥
2
=
max
{
∥
A
∥
2
,
∥
B
∥
2
}
.
\left\|\left(\begin{array}{cc} \mathbf{A} & \mathbf{0} \\ \mathbf{0} & \mathbf{B} \end{array}\right)\right\|_2=\max \left\{\|\mathbf{A}\|_2,\|\mathbf{B}\|_2\right\} .
(A00B)
2=max{∥A∥2,∥B∥2}.
(5.2.13)的证明如下:
由题可知,如果
U
U
∗
=
I
\mathbf{U U}^*=\mathbf{I}
UU∗=I,那么可得:
∥
U
∗
A
x
∥
2
2
=
x
∗
A
∗
U
U
∗
A
x
=
x
∗
A
∗
A
x
=
∥
A
x
∥
2
2
\left\|\mathbf{U}^* \mathbf{A} \mathbf{x}\right\|_2^2=\mathbf{x}^* \mathbf{A}^* \mathbf{U} \mathbf{U}^* \mathbf{A} \mathbf{x}=\mathbf{x}^* \mathbf{A}^* \mathbf{A} \mathbf{x}=\|\mathbf{A} \mathbf{x}\|_2^2
∥U∗Ax∥22=x∗A∗UU∗Ax=x∗A∗Ax=∥Ax∥22
故可推出:
∥
U
∗
A
∥
2
=
max
∥
x
∥
2
=
1
∥
U
∗
A
x
∥
2
=
max
∥
x
∥
2
=
1
∥
A
x
∥
2
=
∥
A
∥
2
\left\|\mathbf{U}^* \mathbf{A}\right\|_2=\max _{\|\mathbf{x}\|_2=1}\left\|\mathbf{U}^* \mathbf{A} \mathbf{x}\right\|_2=\max _{\|\mathbf{x}\|_2=1}\|\mathbf{A} \mathbf{x}\|_2=\|\mathbf{A}\|_2
∥U∗A∥2=∥x∥2=1max∥U∗Ax∥2=∥x∥2=1max∥Ax∥2=∥A∥2
如果
V
∗
V
=
I
\mathbf{V}^* \mathbf{V}=\mathbf{I}
V∗V=I,使用刚才证明的
∥
A
∥
2
=
∥
A
∗
∥
2
\|\mathbf{A}\|_2=\left\|\mathbf{A}^*\right\|_2
∥A∥2=∥A∗∥2可以推出:
∥
A
V
∥
2
=
∥
(
A
V
)
∗
∥
2
=
∥
V
∗
A
∗
∥
2
=
∥
A
∗
∥
2
=
∥
A
∥
2
⟹
∥
U
∗
A
V
∥
2
=
∥
A
∥
2
\|\mathbf{A V}\|_2=\left\|(\mathbf{A V})^*\right\|_2=\left\|\mathbf{V}^* \mathbf{A}^*\right\|_2=\left\|\mathbf{A}^*\right\|_2=\|\mathbf{A}\|_2 \\ \Longrightarrow \quad\left\|\mathbf{U}^* \mathbf{A V}\right\|_2=\|\mathbf{A}\|_2
∥AV∥2=∥(AV)∗∥2=∥V∗A∗∥2=∥A∗∥2=∥A∥2⟹∥U∗AV∥2=∥A∥2
证明题2解答
(5.2.14)的证明如下:
对于所有
∣
∣
x
∣
∣
1
=
1
||\mathbf{x}||_1=1
∣∣x∣∣1=1的
x
\mathbf{x}
x,由标量三角不等式可知:
∥
A
x
∥
1
=
∑
i
∣
A
i
∗
x
∣
=
∑
i
∣
∑
j
a
i
j
x
j
∣
≤
∑
i
∑
j
∣
a
i
j
∣
∣
x
j
∣
=
∑
j
(
∣
x
j
∣
∑
i
∣
a
i
j
∣
)
≤
(
∑
j
∣
x
j
∣
)
(
max
j
∑
i
∣
a
i
j
∣
)
=
max
j
∑
i
∣
a
i
j
∣
.
\begin{aligned} \|\mathbf{A} \mathbf{x}\|_1 & =\sum_i\left|\mathbf{A}_{i *} \mathbf{x}\right|=\sum_i\left|\sum_j a_{i j} x_j\right| \leq \sum_i \sum_j\left|a_{i j}\right|\left|x_j\right|=\sum_j\left(\left|x_j\right| \sum_i\left|a_{i j}\right|\right) \\ & \leq\left(\sum_j\left|x_j\right|\right)\left(\max _j \sum_i\left|a_{i j}\right|\right)=\max _j \sum_i\left|a_{i j}\right| . \end{aligned}
∥Ax∥1=i∑∣Ai∗x∣=i∑
j∑aijxj
≤i∑j∑∣aij∣∣xj∣=j∑(∣xj∣i∑∣aij∣)≤(j∑∣xj∣)(jmaxi∑∣aij∣)=jmaxi∑∣aij∣.
上述不等式可以取到等式,是因为如果
A
∗
k
\mathbf{A}_{*k}
A∗k是绝对值和最大的列,令
x
=
e
k
\mathbf{x}=\mathbf{e}_k
x=ek,并注意到
∣
∣
e
k
∣
∣
1
=
1
||\mathbf{e_k}||_1=1
∣∣ek∣∣1=1, 并且
∥ A e k ∥ 1 = ∥ A ∗ k ∥ 1 = max j ∑ i ∣ a i j ∣ \left\|\mathbf{A e}_k\right\|_1=\left\|\mathbf{A}_{* k}\right\|_1=\max _j \sum_i\left|a_{i j}\right| ∥Aek∥1=∥A∗k∥1=maxj∑i∣aij∣, 故上式得证。
(5.2.15)的证明如下:
对于所有
∣
∣
x
∣
∣
∞
=
1
||\mathbf{x}||_{∞}=1
∣∣x∣∣∞=1的
x
\mathbf{x}
x,可知:
∥
A
x
∥
∞
=
max
i
∣
∑
j
a
i
j
x
j
∣
≤
max
i
∑
j
∣
a
i
j
∣
∣
x
j
∣
≤
max
i
∑
j
∣
a
i
j
∣
.
\|\mathbf{A} \mathbf{x}\|_{\infty}=\max _i\left|\sum_j a_{i j} x_j\right| \leq \max _i \sum_j\left|a_{i j}\right|\left|x_j\right| \leq \max _i \sum_j\left|a_{i j}\right| .
∥Ax∥∞=imax
j∑aijxj
≤imaxj∑∣aij∣∣xj∣≤imaxj∑∣aij∣.
上述不等式可取得等号,是因为如果
A
k
∗
\mathbf{A}_{k*}
Ak∗是绝对值和最大的行,并且如果
x
\mathbf{x}
x是满足如下条件的向量:
x
j
=
{
1
if
a
k
j
≥
0
−
1
if
a
k
j
<
0
x_j=\left\{\begin{aligned} 1 & \text { if } a_{k j} \geq 0 \\ -1 & \text { if } a_{k j}<0 \end{aligned}\right.
xj={1−1 if akj≥0 if akj<0
那么可以得到:
{
∣
A
i
∗
x
∣
=
∣
∑
j
a
i
j
x
j
∣
≤
∑
j
∣
a
i
j
∣
for all
i
,
∣
A
k
∗
x
∣
=
∑
j
∣
a
k
j
∣
=
max
i
l
∑
j
∣
a
i
j
∣
,
\left\{\begin{array}{l} \left|\mathbf{A}_{i *} \mathbf{x}\right|=\left|\sum_j a_{i j} x_j\right| \leq \sum_j\left|a_{i j}\right| \text { for all } i, \\ \left|\mathbf{A}_{k *} \mathbf{x}\right|=\sum_j\left|a_{k j}\right|=\max _{i l} \sum_j\left|a_{i j}\right|, \end{array}\right.
{∣Ai∗x∣=
∑jaijxj
≤∑j∣aij∣ for all i,∣Ak∗x∣=∑j∣akj∣=maxil∑j∣aij∣,
故可得
∣
∣
x
∣
∣
∞
=
1
||\mathbf{x}||_{∞}=1
∣∣x∣∣∞=1,以及
∥
A
x
∥
∞
=
max
i
∣
A
i
∗
x
∣
=
max
i
∑
j
∣
a
i
j
∣
\|\mathbf{A} \mathbf{x}\|_{\infty}=\max _i\left|\mathbf{A}_{i *} \mathbf{x}\right|=\max _i \sum_j\left|a_{i j}\right|
∥Ax∥∞=maxi∣Ai∗x∣=maxi∑j∣aij∣,故上式得证。
第6题解答
可以通过举反例的方式说明,如果取
x
=
e
1
\mathbf{x}=\mathbf{e}_1
x=e1,
y
=
e
2
\mathbf{y}=\mathbf{e}_2
y=e2的话,那么可知:
∥
e
1
+
e
2
∥
∞
2
+
∥
e
1
−
e
2
∥
∞
2
=
2
,
\left\|\mathbf{e}_1+\mathbf{e}_2\right\|_{\infty}^2+\left\|\mathbf{e}_1-\mathbf{e}_2\right\|_{\infty}^2=2,
∥e1+e2∥∞2+∥e1−e2∥∞2=2,
但是
2
(
∥
e
1
∥
∞
2
+
∥
e
2
∥
∞
2
)
=
4
2\left(\left\|\mathbf{e}_1\right\|_{\infty}^2+\left\|\mathbf{e}_2\right\|_{\infty}^2\right)=4
2(∥e1∥∞2+∥e2∥∞2)=4,故可证。
第11题解答
此时不会有任何改变,因为对正交向量集使用Gram-Schmidt化所得到的结果与原集合相同
第1题解答
x = ( 2 1 − 4 − 2 ) \mathbf{x}=\left(\begin{array}{r}2 \\ 1 \\ -4 \\ -2\end{array}\right) x= 21−4−2 :
1-norms为:|2|+|1|+|-4|+|-2|=2+1+4+2=9
2-norms为:sqrt(|2|^2+|1|+|-4|+|-2|)=sqrt(25)=5
∞-norms为:4
x = ( 1 + i 1 − i 1 4 i ) \mathbf{x}=\left(\begin{array}{c}1+\mathrm{i} \\ 1-\mathrm{i} \\ 1 \\ 4 \mathrm{i}\end{array}\right) x= 1+i1−i14i
1-norms为:|1+i|+|1-i|+|1|+|4i|= 2 2 + 1 + 4 2\sqrt{2} +1+4 22+1+4= 2 2 + 5 2\sqrt{2} +5 22+5
2-norms为: 2 + 2 + 1 + 16 = 21 \sqrt{2+2+1+16}=\sqrt{21} 2+2+1+16=21
∞-norms为:4
第2题解答
∥ x − y ∥ = ∥ ( − 1 ) ( y − x ) ∥ = ∣ ( − 1 ) ∣ ∥ y − x ∥ = ∥ y − x ∥ \|\mathbf{x}-\mathbf{y}\|=\|(-1)(\mathbf{y}-\mathbf{x})\|=|(-1)|\|\mathbf{y}-\mathbf{x}\|=\|\mathbf{y}-\mathbf{x}\| ∥x−y∥=∥(−1)(y−x)∥=∣(−1)∣∥y−x∥=∥y−x∥
向量范数的齐次性
第3题解答
可以求得 A A T = ( 5 − 5 − 5 5 ) \mathbf{A}\mathbf{A}^{T}=\left(\begin{array}{l} 5 & -5 \\ -5 & 5 \end{array}\right) AAT=(5−5−55),
矩阵F范数 ∥ A ∥ F \|\mathbf{A}\|_F ∥A∥F为 t r a c e ( A A T ) = 10 \sqrt{trace(\mathbf{A}\mathbf{A}^{T})}=\sqrt{10} trace(AAT)=10,
矩阵1范数 ∥ A ∥ 1 \|\mathbf{A}\|_1 ∥A∥1为模的最大列和:4
矩阵2范数 ∥ A ∥ 2 \|\mathbf{A}\|_2 ∥A∥2为最大奇异值,或者说 A A T \mathbf{A}\mathbf{A}^{T} AAT的最大特征值开根号。
矩阵∞范数 ∥ A ∥ ∞ \|\mathbf{A}\|_{∞} ∥A∥∞为模的最大行和:3
可以求得:
C
C
T
=
(
36
−
18
36
−
18
9
−
18
36
−
18
36
)
\mathbf{C}\mathbf{C}^{T}=\left(\begin{array}{l} 36 & -18 &36 \\ -18 & 9&-18 \\ 36&-18&36 \end{array}\right)
CCT=
36−1836−189−1836−1836
矩阵F范数
∥
A
∥
F
\|\mathbf{A}\|_F
∥A∥F为
t
r
a
c
e
(
A
A
T
)
=
81
=
9
\sqrt{trace(\mathbf{A}\mathbf{A}^{T})}=\sqrt{81}=9
trace(AAT)=81=9,
矩阵1范数 ∥ A ∥ 1 \|\mathbf{A}\|_1 ∥A∥1为模的最大列和:90
矩阵2范数 ∥ A ∥ 2 \|\mathbf{A}\|_2 ∥A∥2为最大奇异值,或者说 A A T \mathbf{A}\mathbf{A}^{T} AAT的最大特征值开根号。
矩阵∞范数 ∥ A ∥ ∞ \|\mathbf{A}\|_{∞} ∥A∥∞为模的最大行和:90
第4题解答
∥ A ∥ F = t r a c e ( A ∗ A ) = t r a c e ( A A ∗ ) = ∥ A ∗ ∥ F \|\mathbf{A}\|_F=\sqrt{trace(\mathbf{A}^{*}\mathbf{A})}=\sqrt{trace(\mathbf{A}\mathbf{A}^{*})}=\|\mathbf{A^{*}}\|_F ∥A∥F=trace(A∗A)=trace(AA∗)=∥A∗∥F
第5题解答
第6题解答
可以通过举反例的方式说明,如果取
x
=
e
1
\mathbf{x}=\mathbf{e}_1
x=e1,
y
=
e
2
\mathbf{y}=\mathbf{e}_2
y=e2的话,那么可知:
∥
e
1
+
e
2
∥
∞
2
+
∥
e
1
−
e
2
∥
∞
2
=
2
,
\left\|\mathbf{e}_1+\mathbf{e}_2\right\|_{\infty}^2+\left\|\mathbf{e}_1-\mathbf{e}_2\right\|_{\infty}^2=2,
∥e1+e2∥∞2+∥e1−e2∥∞2=2,
但是
2
(
∥
e
1
∥
∞
2
+
∥
e
2
∥
∞
2
)
=
4
2\left(\left\|\mathbf{e}_1\right\|_{\infty}^2+\left\|\mathbf{e}_2\right\|_{\infty}^2\right)=4
2(∥e1∥∞2+∥e2∥∞2)=4,故可证。
第7题解答
第8题解答
第9题解答
第10题解答
第11题解答
此时不会有任何改变,因为对正交向量集使用Gram-Schmidt化所得到的结果与原集合相同
第12题解答
QR分解的具体过程
第13题解答
正交矩阵的定义,P*P^T=I
第14题解答
第15题解答
第16题解答
