12、音频处理中的心理声学模型与熵编码技术

音频处理中的心理声学模型与熵编码技术

1. 心理声学模型基础

1.1 安静阈值计算

在心理声学模型中,需要计算Bark子带中的安静阈值。代码如下:

f=bark2hz(barks)+1e−6
#Threshold of quiet in the Bark subbands in dB:
LTQ=np.clip((3.64*(f/1000.)**−0.8 −6.5*np.exp(−0.6*(f/1000.−3.3)**2.)
+1e−3*((f/1000.)**4.)),−20,120)
#Maximum of spreading functions and hearing threshold in quiet:
mTbark=np.max((mTbark, 10.0**((LTQ−60)/20)),0)
return mTbark

1.2 完整心理声学模型构建

将各个函数组合成一个完整的心理声学模型,步骤如下:
1. 对输入信号 x 进行离散傅里叶变换(DFT)并取幅值。
2. 将频谱映射到Bark尺度。
3. 应用扩展函数及其非线性叠加。
4. 计算安静环境下的听觉阈值。
5. 将得到的掩蔽阈值映射回线性频率域。

以下是代码示例:

mX=np.abs(np.fft.fft(x[0:2048],norm='ortho'))[0:1025]
mXbark=mapping2bar
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值