Mel倒谱的缺陷。Defeat of Mel Frequency Cepstrum Coefficients

最新推荐文章于 2022-12-11 22:07:11 发布

原创最新推荐文章于 2022-12-11 22:07:11 发布 · 406 阅读

0 ·

CC 4.0 BY-SA版权

本文探讨了MelSpectrum作为FFT频谱采样的应用及其存在的问题,尤其是在使用三角函数采样时导致的特征模糊现象。同时,文章还讨论了MFCC特性针对固定频率的局限性,以及同一声源在不同频率发声时特征的变化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

首先Mel Spectrum是对FFT后的频谱的采样，而且使用了三角函数采样。这样在采样中心的频率会被分配到两个不同的Mel频谱点。使得特征不能很好的反映声音信号。

其次,MFCC所有特征针对固定频率。因此需要训练。即使同一个声源在不同的频率（音高）发声，其特征也不同。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zigong

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

梅尔频率倒谱系数（MFCC）学习笔记

weixin_30444105的博客

02-14

5148

最近学习音乐自动标注的过程中，看到了有关使用MFCC提取音频特征的内容，特地在网上找到资料，学习了一下相关内容。此笔记大部分内容摘自博文 http://blog.youkuaiyun.com/zouxy09/article/details/9156785 有小部分标注和批改时我自己加上的，以便今后查阅。语音信号处理之（四）梅尔频率倒谱系数（MFCC） zouxy09@qq.com htt...

MFCC理解

James_bobo的博客

09-26

8979

MFCC 在语音识别（SpeechRecognition）和话者识别（SpeakerRecognition）方面，最常用到的语音特征就是梅尔倒谱系数（Mel-scaleFrequency Cepstral Coefficients，简称MFCC）。根据人耳听觉机理的研究发现，人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响对大。两个响度不等的声音作用于...

参与评论您还未登录，请先登录后发表或查看评论

梅尔倒频谱系数（Mel-frequency cepstrum Coefficents）

weixin_30251829的博客

02-08

1249

简介梅尔倒频谱（MFC）在声音处理中，梅尔倒频谱（MFC）表示了声音短时功率谱。它基于非线性梅尔刻度频率的对数功率谱的一个线性余弦变换。梅尔频率倒谱系数（MFCC）梅尔频率倒谱系数（MFCC）是所有构成MFC的系数。倒谱和梅尔频率倒谱的区别在梅尔倒频谱中，频带是等距地分布在Mel尺度上的，相比于在正常倒谱中线性间隔的频带，这种等距分布的频带...

mfcc——Mel frequency cepstrum coefficient

10-31

该方法对声学信号的特征提取十分有效，可广泛用于航空航天、建筑机械、土木工程、健康监测

深入理解MFCC（梅尔频率倒谱系数）

DEDSEC_Roger的博客

12-11

3万+

取得13个系数后，还会在时序上，对13个系数求一阶差分和二阶差分，二阶差分等价于对一阶差分求一阶差分。表示第n帧的13个系数，将一阶差分和二阶差分与原函数值拼接起来，得到39个系数。通常选取前12个系数，再拼接一个当前frame的能量，共13个。MFCC的输出可以表示为一个二维数组，shape为。越靠前的系数，包含越多的基频和共振峰的信息。，由于是二维数组，所以可以用热力图可视化。

Mel倒谱系数

weixin_30314813的博客

11-24

872

Mel倒谱系数：MFCC Mel频率倒谱系数（Mel Frequency Cepstrum Coefficient）的缩写是MFCC，Mel频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征。用录音设备录制一段模拟语音信号后，经由自定的取样频率(如8000 Hz、16000 Hz...

MFCC.rar_Extraction of Mel_mel frequency_mfcc特征_信号提取matlab_倒谱检测

07-14

为了实现高速语音特征参数的提取，在分析了美尔频率倒谱特征参数提取算法的基础上，提出了算法的硬件设计方案，介绍了各模块的设计原理。该方案增加了语音激活检测功能，可对语音信号中的噪音帧进行检测，提高了...

正弦信号的matlab代码-Mel-Frequency-Cepstral-Coefficients:梅尔频率倒谱系数

05-21

正弦信号的matlab代码梅尔频率倒谱系数梅尔频率倒谱系数该代码按照与Matlab中相同的步骤（功能：mfcc）来计算梅尔频率倒谱系数。该代码使用默认的40频段滤波器组，其范围大约为133 Hz至6864 Hz，如Matlab中所述。...

mfcc.rar_LPC系数_MFCC c++_Mel_cepstrum tutorial_倒谱

09-24

MFCC（Mel Frequency Cepstral Coefficients，梅尔频率倒谱系数）是语音识别、音频处理领域常用的一种特征提取技术。它通过模拟人类听觉系统对声音的感知，将原始音频信号转换为一组易于处理的参数。在这个过程中，...

melp1.2.rar_MEl倒谱系数_melp1.2_倒谱系数

07-14

语音信号处理中的mel倒谱系数的算法，可以参考下

梅尔频率倒谱系数MFCC总结

一个人要像一支队伍

06-11

6886

一、听觉特性。人们不能完全搞清楚人耳的内部构造，这就不能利用状态空间的方法来分析人耳的听觉特性。但是，可以把人耳当成黑匣子，声音作为激励，人类的反应作为响应，利用信号与系统的经典分析方法，把声音作用于人耳，并观察人类的反应。于是，得到了人耳的听觉特性。 1、人耳对频率具有选择性。人耳听到的声音的高低与声音频率不成线性关系，而是与该声音频率的对数近似成线性正比关系。 2、人类不能有效地分...

MelGeneralizedCepstrums.jl：Mel广义倒谱分析

02-04

MelGeneralizedCepstrums.jl：Mel广义倒谱分析

语音识别（五）——Mel-Frequency Analysis, FBank, 语音识别的评价指标, 声学模型进阶

antkillerfarm的专栏

09-10

8834

Cepstrum Analysis（续）这里，我们对Fourier transform做一个简单的回顾。设h(t)是一个时域函数，而H(f)是一个频域函数，则Fourier transform为： H(f)=∫∞−∞h(t)e2πiftdtH(f)=∫−∞∞h(t)e2πiftdtH(f)=\int_{-\infty}^\infty h(t)e^{2\pi i ft}\mathrm{...

Mel Frequency Cepstral Coefficient (MFCC)提取

二黑的博客

12-12

2363

MFCC提取： opensmile工具箱官方的opensmile文档提取的MFCC压根打不开，所以在此就需要该官方的配置文件，opensmile-2.3.0/config/MFCC12_0_D_A.conf (官方的配置文件对提取的语音特征都有着详细的说明，每一个conf文件提取的特征都有所不同，根据自己需要来修改) 1、进入opensmile-2.3.0/bin/Win32后，按住sh

音频特征Mel Frequency Cepstral Coefficient (MFCC)提取(语音识别)

yunnangf的博客

01-03

1万+

语音识别系统之音频特征MFCC提取

语音信号处理之（四）梅尔频率倒谱系数（MFCC）

u010384318的专栏

08-17

7379

在任意一个Automatic speech recognition 系统中，第一步就是提取特征。换句话说，我们需要把音频信号中具有辨识性的成分提取出来，然后把其他的乱七八糟的信息扔掉，例如背景噪声啊，情绪啊等等。搞清语音是怎么产生的对于我们理解语音有很大帮助。人通过声道产生声音，声道的shape（形状？）决定了发出怎样的声音。声道的shape包括舌头，牙齿等。如果我们可以准确的知道这个形状

基于倒谱法、自相关法、短时幅度差法的基音频率估计算法（MATLAB及验证）

qq_43411654的博客

06-18

1万+

基音频率检测一、概念何为基音周期？人在发音时，根据声带是否振动可以将语音信号分为清音和浊音两种。浊音携带大量的能量，因此又被称为有声语音，其在时域上有明显的周期性。而清音类似于白噪声，没有明显的周期性。发浊音时，气流通过声门使声带产生张弛震荡式振动，产生准周期的激励脉冲串。这种声带振动的频率称为基音频率；相应的周期就称为基音周期。基音频率与个人声带的情况有关，包括声带长短、薄厚、韧性、劲度和发音习惯，总的来说基音频率就是说话人的特征之一。而且基音频率还随着人的性别、年龄不同而有所不同。男性大概在702

音频信号处理——基音周期