首先Mel Spectrum是对FFT后的频谱的采样,而且使用了三角函数采样。这样在采样中心的频率会被分配到两个不同的Mel频谱点。使得特征不能很好的反映声音信号。
其次,MFCC所有特征针对固定频率。因此需要训练。即使同一个声源在不同的频率(音高)发声,其特征也不同。
首先Mel Spectrum是对FFT后的频谱的采样,而且使用了三角函数采样。这样在采样中心的频率会被分配到两个不同的Mel频谱点。使得特征不能很好的反映声音信号。
其次,MFCC所有特征针对固定频率。因此需要训练。即使同一个声源在不同的频率(音高)发声,其特征也不同。