目录
1.算法概述
一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线如图1所示。
图1一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线
在时刻0.5s处,短时能量很小但短时平均幅度相对较大,表明了能量对幅度的敏感性,其他类似的时刻如0.2s位置也一样。过零率在浊音处具有比较小的值,在清音处有较大的值,关于静默音,看另一段语音,如图2。
图2另一段语音信号及其归一化的短时能量、短时平均幅度和短时过零率曲线。在几个明显静音段,如1s、2s处及5s之后的片段,过零率都很大。但是过零率大的地方不一定就是静默音,清音也是可能的,静默音能量几乎为零,而清音和浊音都具有一定的能量。所以要识别清浊音和静默音需要短时能量和短时过零率的结合,有时还需要结合其他参数。