目录
1.算法概述
一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线如图1所示。

图1一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线
在时刻0.5s处,短时能量很小但短时平均幅度相对较大,表明了能量对幅度的敏感性,其他类似的时刻如0.2s位置也一样。过零率在浊音处具有比较小的值,在清音处有较大的值,关于静默音,看另一段语音,如图2。

图2另一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线。在几个明显静音段,如1s、2s处及5s之后的片段,过零率都很大。但是过零率大的地方不一定就是静默音,清音也是可能的,静默音能量几乎为零,而清音和浊音都具有一定的能量。所以要识别清浊音和静默音需要短时能量和短时过零率的结合,有时还需要结合其他参数。
本文介绍了语音信号处理中的短时过零率、短时能量和短时自相关概念,并通过MATLAB 2022a进行了仿真,展示了在不同语音状态下的特征变化,尤其是静默、清音和浊音的区分。
订阅专栏 解锁全文
887

被折叠的 条评论
为什么被折叠?



