模与内积(四)矩阵分析与应用 国科大

上一节的最后是标准正交基,其需要满足各个向量之间正交且范数为1,接下来讲标准正交基的重要应用——傅里叶展开与施密特正交化。

傅里叶展开

\mathcal{B} = \{\mathbf{u}_1, \mathbf{u}_2, \dots, \mathbf{u}_n\}是内积空间\mathcal{V}的标准正交基,则对任意\mathbf{x} \in \mathcal{V},可展开为:\mathbf{x} = \langle \mathbf{u}_1 | \mathbf{x} \rangle \mathbf{u}_1 + \langle \mathbf{u}_2 | \mathbf{x} \rangle \mathbf{u}_2 + \dots + \langle \mathbf{u}_n | \mathbf{x} \rangle \mathbf{u}_n

其中傅里叶系数:\xi_i = \langle \mathbf{u}_i | \mathbf{x} \rangle在基\mathcal{B}下的坐标;

傅里叶级数

首先我们回忆一下傅里叶级数是怎么来的:

同样的方法也可以求解出b_n,这样就得到了最常见的傅里叶级数的形式。

向量的傅里叶展开

下面我们来看如何对一个向量进行傅里叶展开:

1、函数内积的定义

首先我们需要定义一下两个函数如何做内积,在之前我们定义向量内积时,说过它本质上就是两个向量的每个对应分量做乘积再求和,但向量毕竟是离散的,而函数是连续的,连续的内积该如何定义呢?

高数中有提到:离散下的求和对应在连续下就是积分,所有函数内积定义为两个函数先相乘,在对乘积做积分。对于傅里叶变换定义在(-\pi, \pi )上,它的内积如上图所示。

2、标准正交基

大家可以自行检验这个集是否符合,对于范数,可以分为常数、cos、sin三类检验范数是否为1;对于内积,也可以分常数、cos、sin三类之间作内积看是否为0;

3、傅里叶展开

傅里叶展开与傅里叶级数的联系

讲傅里叶系数带入之后即可变为傅里叶级数。带入计算后可发现对应系数有下面关系:

  • \alpha_0 = \frac{a_0}{2} \cdot \sqrt{2\pi},即a_0 = \frac{2}{\sqrt{2\pi}} \alpha_0 = \frac{\sqrt{2}}{\sqrt{\pi}} \alpha_0
  • \alpha_n = a_n \cdot \sqrt{\pi},即a_n = \frac{\alpha_n}{\sqrt{\pi}}
  • \beta_n = b_n \cdot \sqrt{\pi},即b_n = \frac{\beta_n}{\sqrt{\pi}}

至此,就完成了如何把一个函数通过标准正交基的方式进行傅里叶展开。事实上,傅里叶展开的本质就是把任意一个周期函数写成正余弦函数的线性表示。

施密特正交化

所有有限维内积空间都存在标准正交基,施密特正交化的作用是将向量空间中一组任意的集变为一组标准正交的基,它的形式毕竟复杂,但理解起来是并不困难的

先以二维空间(平面)为例:

目标:将二维向量空间中的一组基(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,其中\boldsymbol{\alpha}_1\boldsymbol{\beta }_1共线)转换为正交的一组基(\boldsymbol{\beta }_1,\boldsymbol{\beta }_2

首先我们选择\boldsymbol{\alpha}_1为基准,将其单位化后记作\boldsymbol{\beta }_1

如果想要\boldsymbol{\alpha }_2\boldsymbol{\beta }_1正交(即垂直),从向量加减的角度来看,需要\boldsymbol{\alpha }_2减去\boldsymbol{\alpha }_2\boldsymbol{\beta }_1上的投影,这样得到的\boldsymbol{\beta }_2恰好与\boldsymbol{\beta }_1垂直,再进行单位化即可;

现在的目标变为如何求解\boldsymbol{\alpha }_2\boldsymbol{\beta }_1上的投影;(投影的本质:就是需要原向量的长度+投影向量的方向

从三角函数的角度来看,这个问题非常好解决,即\boldsymbol{\alpha }_2乘上\cos\theta\theta\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2的夹角)

借助这个想法,得到\boldsymbol{\alpha }_2\boldsymbol{\alpha}_1方向上的投影向量,需要将 “投影长度” 乘以\boldsymbol{\alpha}_1方向的单位向量(即\frac{\boldsymbol{\alpha}_1}{\|\boldsymbol{\alpha}_1\|}),因此投影向量为:\left( \|\boldsymbol{\alpha}_2\| \cdot \cos\theta \right) \cdot \frac{\boldsymbol{\alpha}_1}{\|\boldsymbol{\alpha}_1\|}

\cos\theta = \frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\|\boldsymbol{\alpha}_1\| \cdot \|\boldsymbol{\alpha}_2\|}代入上式,化简得:\left( \|\boldsymbol{\alpha}_2\| \cdot \frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\|\boldsymbol{\alpha}_1\| \cdot \|\boldsymbol{\alpha}_2\|} \right) \cdot \frac{\boldsymbol{\alpha}_1}{\|\boldsymbol{\alpha}_1\|} = \frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_1 \rangle} \cdot \boldsymbol{\alpha}_1

最后,再用\boldsymbol{\alpha}_2-\frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_1 \rangle} \cdot \boldsymbol{\alpha}_1即得到了\boldsymbol{\beta }_2

对应二维施密特正交化总结如下:

1、\boldsymbol{\beta }_1=\boldsymbol{\alpha }_1

2、\boldsymbol{\beta }_2=\boldsymbol{\alpha}_2-\frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_1 \rangle} \cdot \boldsymbol{\alpha}_1=\boldsymbol{\alpha}_2-\frac{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_2 \rangle}{\langle \boldsymbol{\alpha}_1 | \boldsymbol{\alpha}_1 \rangle} \cdot \boldsymbol{\beta }_1

同样的,三维施密特正交化也是这样,将第三个向量减去在前两个已经正交化的投影即可。

这里推荐一个GIF:三维施密特正交化可视化(我插入文章中的GIF太小了,这里是原文中的第一张动图,原文写的非常好,所有推导过程附带图片):

对应任意的维度,施密特正交化公式如下:

施密特正交化的向量形式与矩阵形式

1、向量形式

这个过程与我们之前推导的一致,只不过写成了求和的形式

2、矩阵形式

对于施密特过程的第k步,记已构造的前k-1个标准正交向量为\mathbf{u}_1, \mathbf{u}_2, \dots, \mathbf{u}_{k-1},将它们按列拼接成矩阵:\mathbf{U}_k = \left[ \mathbf{u}_1 \mid \mathbf{u}_2 \mid \dots \mid \mathbf{u}_{k-1} \right] \in \mathbb{C}^{m \times (k-1)}

向量\mathbf{x}_k\text{span}\{\mathbf{u}_1, \dots, \mathbf{u}_{k-1}\}上的正交投影为:\mathbf{P}_k \mathbf{x}_k = \mathbf{U}_k \mathbf{U}_k^* \mathbf{x}_k

再用\mathbf{x}_k减去投影\mathbf{U}_k \mathbf{U}_k^* \mathbf{x}_k,进行单位化即可写成矩阵表示。

(正交投影矩阵后续还会再介绍,这里大家理解它的作用即可)

从施密特正交化到QR分解

设矩阵\mathbf{A}_{m \times n} = [\mathbf{a}_1 \mid \mathbf{a}_2 \mid \dots \mid \mathbf{a}_n]的列向量线性无关(列满秩),对其列向量应用施密特过程,得到列空间R(\mathbf{A})的标准正交基\{\mathbf{q}_1, \mathbf{q}_2, \dots, \mathbf{q}_n\}

  • k=1时:\mathbf{a}_1 = \nu_1 \mathbf{q}_1
  • k \geq 2时:\mathbf{a}_k = \sum_{i=1}^{k-1} \langle \mathbf{q}_i | \mathbf{a}_k \rangle \mathbf{q}_i + \nu_k \mathbf{q}_k

为什么k \geq 2是这种形式:

接下来,将这一关系写成矩阵形式:

这里,我们实际上把一个矩阵分解为了正交矩阵Q,和上三角矩阵R。

QR分解

列满秩矩阵\mathbf{A}_{m \times n}(列向量线性无关),可唯一分解为:\mathbf{A} = \mathbf{Q}_{m \times n} \mathbf{R}_{n \times n}其中:

  • \mathbf{Q}的列是\mathbf{A}的列空间R(\mathbf{A})标准正交基(满足\mathbf{Q}^* \mathbf{Q} = \mathbf{I}_n);
  • \mathbf{R}上三角矩阵,且对角线元素均为正数

例子:

我觉得实际上求解中不需要这样做

可以先用施密特正交化求解出Q矩阵,由于Q是正交矩阵,其逆矩阵就是它的转置,因此,直接用Q的转置乘上A即可得到R矩阵。这种方法和上图本质上是一样的,只不过上图是一个一个算,这种方法是一起求出,对于手算来说更方便一些。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值