【python】计算mel频率可能比你想象的要复杂一点

本文探讨了如何通过Mel计算公式进行音频处理,并揭示了librosa库中Hz到Mel转换的htk参数的重要性。作者比较了不同实现(Slaney vs HTK)并解释了为何结果不符,以及如何通过设置htk=True匹配标准公式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Mel计算公式

计算mel频率可以直接套用公式,

公式如下,

m = 2595 l o g 10 ( 1 + f 700 ) m = 2595 log_{10}(1+ \frac{f} {700}) m=2595log10(1+700f)

所以实现上如下

import numpy as np
import librosa

def mel_calculate(freq):
    return 2595 * np.log10(1+freq/700)

for f in np.linspace(10,1000,num=10):
    my_mel = mel_calculate(f)
    mel = librosa.hz_to_mel(f)
    print(f"freq {f}, cal:{my_mel}, librosa:{mel}")

为了做结果上的验证,我使用了librosa来核对计算结果。
在这里插入图片描述
但是发现结果居然跟librosa的不一样,这是为什么呢?

查看librosa的官方文档,有关hz_to_mel的使用,其实是有一个参数

在这里插入图片描述
查寻源码发现,只有在htk=True的时候,才使用开头的公式。

下图是hz_to_mel源码部分中htk的判断
hz_to_mel源码部分

那么这个htk是什么含义呢?

什么是htk

在另外一个函数librosa.mel_frequencies的api介绍中,有关于htk的说明

By default, librosa replicates the behavior of the well-established MATLAB Auditory Toolbox of Slaney.
librosa默认使用slaney实现,这是在MATLAB Auditory Toolbox中的实现。
According to this default implementation, the conversion from Hertz to mel is linear below 1 kHz and logarithmic above 1 kHz.
在这种实现下,转换在1千赫以下是线性的,在1千赫以上是对数的
Another available implementation replicates the Hidden Markov Toolkit (HTK) :
另外一种实现来源Hidden Markov Toolkit ,即HTK

然后针对slaney和HTK,这里信号给了两个参考引用连接

Slaney, M. Auditory Toolbox: A MATLAB Toolbox for Auditory Modeling Work. Technical Report, version 2, Interval Research Corporation, 1998.
Young, S., Evermann, G., Gales, M., Hain, T., Kershaw, D., Liu, X., Moore, G., Odell, J., Ollason, D., Povey, D., Valtchev, V., & Woodland, P. The HTK book, version 3.4. Cambridge University, March 2009.

基本都是20年前的东西了。 但是相比而言,slaney是比HTK稍微新一些的了。

翻阅了一些材料,HTK是针对隐马尔可夫框架做的一个工具包,它有一个在线的htkbook 大部分的介绍也是基于ASR的。

还有一个是Auditory Toolbox,它里面应该就对应着Slaney的实现吧。(没有具体研究)

所以回到开头,如果要匹配到公式实现,所以在参数中需要指定htk=True。即mel = librosa.hz_to_mel(f,htk=True)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值