一、为什么要引入复指数信号?
奥本海姆《信号与系统(第二版)》的第113页最后一行写到:
在研究线性时不变系统时,复指数信号的重要性在于这样一个事实,即一个线性时不变系统对复指数信号的响应也同样是一个复指数信号,不同的只是在幅度上的变化。
简单来说,这句话将复指数信号的重要性归结于:复指数信号是LTI系统的特征函数。
那么,什么是特征函数?
二、特征函数与特征向量
1.特征向量与特征值
为了理解特征函数,需要先回忆一下特征值与特征向量的概念,下面是百度百科的定义:
数学上,线性变换的特征向量(本征向量)是一个非简并的向量,其方向在该变换下不变。该向量在此变换下缩放的比例称为其特征值(本征值)。
A v ⃗ = λ v ⃗ A\vec{v}=\lambda \vec{v} Av=λv
用通俗的语言来讲,乘以一个矩阵A也就是对向量空间进行线性变换,如果变换后的向量空间中存在某个向量只有长度改变,而其方向不变,那么变换后方向不变的向量则称为特征向量,向量长度缩放的比例称为特征值。具体可以参考这个视频:线性代数的本质 - 10 - 特征向量与特征值
这是个非常好的性质,表明了特征向量和特征值是描述矩阵所代表的线性变换的重要工具。试想,如果可以将向量空间内所有向量都分解成特征向量的形式,即特征向量是向量空间的一组基向量(特征基)。利用这个性质,可以将矩阵A通过基变换,变成在特征基下的矩阵B,并且这个矩阵一定是对角矩阵。这里证明略过,但是仔细想想:基变换前后,线性变换的本质保持不变,只是坐标和基向量的表示发生了变化。特征基向量在变换后仍然是方向不变、长度缩放为特征值倍数的向量。在特征基表示下,矩阵 B 必然是对应特征值组成的对角矩阵,因为每个列向量都是基向量缩放特征值倍数的值。
再遇到矩阵乘法(线性变换)时,我们可以先做矩阵对角化(特征基变换),再乘以对应特征值做数乘运算,再逆变换为原来的基坐标,这样复杂的变换就可以变成简单的数乘运算。
看到这里你可能会说,这确实是一个非常好的性质,但是,它和特征函数以及复指数信号完全不沾边啊!
2.向量与函数
首先给出结论向量是离散的函数,函数是无穷维的向量
从无穷维空间的角度,函数f(x)由于x可以取值无穷多,就可以看成是无穷维空间中无穷多的点。也就是包括无穷多数列表的向量。反之,向量也可以看作离散函数,下面是个三维向量函数的图像。
向量 | 函数(信号) |
---|---|
a x → \overrightarrow{a_x} ax | f ( x ) f(x) f(x) |
求和 ∑ x = 1 n a x → \sum\nolimits_{x=1}^n{\overrightarrow{a_x}} ∑x=1nax | 积分 ∫ a b f ( x ) d x \int_a^b{f\left( x \right) dx} ∫abf(x)dx |
内积 a ⃗ ⋅ b ⃗ = ∑ i = 1 n a i b i \vec{a}\cdot \vec{b}=\sum_{i=1}^n{a_i}b_i a⋅b=∑i=1naibi | 相关 ( f ∗ g ) ( x ) = ∫ − ∞ ∞ f ( t ) g ( x − t ) d t (f*g)(x)=\int_{-\infty}^{\infty}{f}(t)g(x-t)\,dt (f∗g)(x)=∫−∞∞f(t)g(x−t)dt |
向量正交 a ⃗ ⋅ b ⃗ = 0 \vec{a} \cdot \vec{b} = 0 a⋅b=0 | 函数正交 ∫ a b f ( x ) g ( x ) d x = 0 \int_a^b f(x)g(x) \, dx = 0 ∫abf(x)g(x)dx=0 |
长度 ∣ a ⃗ ∣ = ∑ i = 1 n a i 2 |\vec{a}| = \sqrt{\sum_{i=1}^n a_i^2} ∣a∣=∑i=1nai2 | 能量 ∥ f ∥ = ∫ − ∞ ∞ f ( x ) 2 d x \sqrt{\text{能量}}\parallel f\parallel =\sqrt{\int_{-\infty}^{\infty}{f}(x)^2\,dx} 能量∥f∥=∫−∞∞f(x)2dx |
特征向量与特征值 A v ⃗ = λ v ⃗ A\vec{v} = \lambda \vec{v} Av=λv | 特征函数与系统函数 h ( t ) ∗ f ( x ) = H ( s ) f ( x ) h(t)*f(x) = H(s) f(x) h(t)∗f(x)=H(s)f(x) |
经过上文的理解,我们知道特征函数和特征向量是一个东西,特征函数是指在经过某个线性算子作用后,其形式保持不变,仅乘以一个常数(特征值)的函数。矩阵A是一种线性算子,矩阵乘法 A v ⃗ A\vec{v} Av可以看作一种线性变换,而LTI系统也是一种线性算子,信号和LTI系统的冲激响应 h ( t ) h(t) h(t)卷积 x ( t ) ∗ h ( t ) x\left( t \right) *h\left( t \right) x(t)∗h(t),也可以看作一种类似于矩阵乘法的线性变换。
矩阵乘向量 u ⃗ = A v ⃗ \vec{u}=A\vec{v} u=Av | 离散卷积 y [ n ] = x [ n ] ∗ h [ n ] y[n]=x\left[ n \right] *h\left[ n \right] y[n]=x[n]∗h[n] | 连续卷积 y ( t ) = x ( t ) ∗ h ( t ) y\left( t \right) =x\left( t \right) *h\left( t \right) y(t)=x(t)∗h(t) |
---|---|---|
u i = ∑ j = 1 n a i j v j u_i=\sum_{j=1}^n{a_{ij}}v_j ui=∑j=1naijvj | y [ n ] = ∑ k = − ∞ ∞ x [ k ] h [ n − k ] y[n]=\sum_{k=-\infty}^{\infty}{x}[k]h[n-k] y[n]=∑k=−∞∞x[k]h[n−k] | y ( t ) = ∫ − ∞ ∞ x ( τ ) h ( t − τ ) d τ y\left( t \right) =\int_{-\infty}^{\infty}{x}(\tau )h(t-\tau )\,d\tau y(t)=∫−∞∞x(τ)h(t−τ)dτ |
那么这个线性变换的特征函数是什么?
现在证明一下:复指数信号是LTI系统的特征函数
y
(
t
)
=
x
(
t
)
∗
h
(
t
)
=
(
e
s
t
)
∗
h
(
t
)
=
∫
−
∞
∞
h
(
τ
)
e
s
(
t
−
τ
)
d
τ
=
e
s
t
∫
−
∞
∞
h
(
τ
)
e
−
s
τ
d
τ
=
H
(
s
)
e
s
t
\begin{aligned} y(t)&=x(t)*h(t)\\ &=\left( e^{st} \right) *h(t)\\ &=\int_{-\infty}^{\infty}{h}(\tau )e^{s(t-\tau )}d\tau\\ &=e^{st}\int_{-\infty}^{\infty}{h}(\tau )e^{-s\tau}d\tau\\ &=H(s)e^{st}\\ \end{aligned}
y(t)=x(t)∗h(t)=(est)∗h(t)=∫−∞∞h(τ)es(t−τ)dτ=est∫−∞∞h(τ)e−sτdτ=H(s)est
根据上式可以明显发现,对于LTI系统而言,当复指数信号
e
s
t
e^{st}
est作用于LTI系统时,输出信号与输入信号保持相同的形式,只是幅度和相位可能发生变化
矩阵乘法可以使用矩阵对角化的方式进行运算,那么卷积有没有方法简化运算呢?答案呼之欲出:拉普拉斯变换的本质是一种类似矩阵对角化的特征基变换,复指数信号是LTI系统的特征向量,系统函数就是LTI系统的特征值,卷积定理实际上描述的是特征向量和特征值的关系。(在此要声明一下:拉普拉斯变换的作用远不止简化运算,这里只是为了和矩阵运算对偶才这样写的)
现在我们来重新审视一下特征基变换与拉普拉斯变换:
特征基变换就是一个矩阵乘法,矩阵里面每个列向量都是新的基向量,特征基变换就是将向量和每一个特征基向量做内积,求出原向量在新的基向量的投影
于是我们可以这样理解傅里叶变换等一系列变换:傅里叶变换就是将原信号和每一个特征信号(虚指数信号)做卷积,求出原信号在各个频率分量的投影。而拉普拉斯变换是傅里叶变换的拓展,它还能告诉我们信号中的指数分量
F
(
ω
)
=
∫
−
∞
∞
f
(
t
)
e
−
j
ω
t
d
t
F
(
s
)
=
∫
0
∞
f
(
t
)
e
−
s
t
d
t
F(\omega )=\int_{-\infty}^{\infty}{f}(t)e^{-j\omega t}\,dt \\ F(s)=\int_0^{\infty}{f}(t)e^{-st}\,dt
F(ω)=∫−∞∞f(t)e−jωtdtF(s)=∫0∞f(t)e−stdt
根据特征向量与特征函数的定义,和特征向量位于同一条直线的向量是特征向量,和特征函数位于同一条直线的函数也是特征函数。所以复指数信号的线性组合也都是特征函数,虚指数信号 e 0 e j ω t e^0e^{j\omega t} e0ejωt和正弦信号 sin ( ω t ) = e j ω t − e − j ω t 2 j \sin(\omega t) = \frac{e^{j\omega t} - e^{-j\omega t}}{2j} sin(ωt)=2jejωt−e−jωt也是LTI系统的特征函数。一开始学习傅里叶级数的时候引入的特征基函数就是正弦信号和余弦信号,这在一开始对于理解频域概念有很大的帮助,但在这之后使用的特征基就一直是虚指数信号。等到了复频域,为了对于不收敛的函数进行分析(通常是不稳定的系统函数),于是将特征基变成了复指数信号,同时还引入了Laplace变换和Z变换。
上文只是解释了为什么复指数信号 e s t e^{st} est可以被引入,但是为什么不是容易理解的正弦函数 sin ( ω t ) \sin(\omega t) sin(ωt)?为什么不是虚指数信号?
3.为什么是复指数信号?
为什么不是正弦信号?正弦信号作为特征基只有在最初引入傅里叶级数概念的时候使用过,之后便被虚指数信号代替。这是因为虚指数信号的简洁性。举个例子,在频域计算过程中
cos
(
ω
t
)
cos
α
\cos \left( \omega t \right) \cos \alpha
cos(ωt)cosα的计算要比
e
j
ω
t
e
α
e^{j\omega t}e^{\alpha}
ejωteα恶心的多。虚指数信号将相位放在指数项,巧妙地将乘法化为加法。
为什么之后又要引入复指数信号呢?引入衰减因子的复指数信号提供了一种统一的分析方法,无论是稳定系统还是不稳定系统,都可以通过复指数信号的形式进行分析。
总结
复指数信号在信号与系统分析中的重要性源于其作为线性时不变系统(LTI系统)的特征函数特性。特征函数在经过LTI系统变换后,形式保持不变,仅幅度变化,这使得复指数信号成为频域分析的理想工具。通过傅里叶变换和拉普拉斯变换,信号可以被分解为复指数信号的线性组合,从而简化卷积运算和频域分析。尽管正弦信号和虚指数信号同样是特征函数,但复指数信号的数学简洁性和统一性使其成为更广泛应用的选择。
感觉还有很多没写完,等之后再来更新吧