文章目录
前言
- 在做talking face generarion时,需要对声音进行处理,还需要使得声音与视频进行对齐,这需要提取声音的MFCC特征以及选择相应的信号处理窗想汉明窗之类,但是对这方面完全不了解,现在来从头学习一下。
正文
信号的分类
-
时域连续信号
像声音信号

-
时域离散信号
自变量取离散值,函数值取连续值,通常来源于对模拟信号的采样

-
数字信号
信号的自变量和函数值均取离散值

时域离散信号
主要研究的是时域离散信号的相关知识
序列的定义

序列表示


- 这里的n代表的是第几次采样

常见序列



注意是N-1,PPT上有错误


原来的
Ω
\Omega
Ω是数字1, 2,
ω
\omega
ω单位是rad,是
Ω
\Omega
Ω与T的乘积




ω \omega ω带 π \pi π就是周期序列,对应着采样的周期与 Ω \Omega Ω的乘积带 π \pi π
用单位脉冲序列表示任意序列

序列的基本运算
序列的翻转

序列的差分

时间尺度变换

- 抽取序列可以看成是对x(n)的再次抽样

- 插值后会形成一个新序列
序列的能量

时域离散系统



线性时不变系统与输入输出的关系


序列的卷积和


- 上图是n为2也就是 y ( 2 ) y_{(2)} y(2)的示意图




本文介绍了时域信号的分类,重点讲解了时域离散信号和数字信号的概念,以及序列的定义和表示方法。通过单位脉冲序列展示了如何表示任意序列,并探讨了序列的基本运算,如翻转、差分和时间尺度变换。此外,还涉及到了序列的能量计算以及线性时不变系统的输入输出关系和序列卷积。对于声音处理和视频对齐的基础知识,理解这些概念至关重要。
2134

被折叠的 条评论
为什么被折叠?



