音频处理中的心理声学模型与熵编码技术
1. 心理声学模型基础
1.1 安静阈值计算
在心理声学模型中,需要计算Bark子带中的安静阈值。代码如下:
f=bark2hz(barks)+1e−6
#Threshold of quiet in the Bark subbands in dB:
LTQ=np.clip((3.64*(f/1000.)**−0.8 −6.5*np.exp(−0.6*(f/1000.−3.3)**2.)
+1e−3*((f/1000.)**4.)),−20,120)
#Maximum of spreading functions and hearing threshold in quiet:
mTbark=np.max((mTbark, 10.0**((LTQ−60)/20)),0)
return mTbark
1.2 完整心理声学模型构建
将各个函数组合成一个完整的心理声学模型,步骤如下:
1. 对输入信号 x 进行离散傅里叶变换(DFT)并取幅值。
2. 将频谱映射到Bark尺度。
3. 应用扩展函数及其非线性叠加。
4. 计算安静环境下的听觉阈值。
5. 将得到的掩蔽阈值映射回线性频率域。
以下是代码示例:
mX=np.abs(np.fft.fft(x[0:2048],norm='ortho'))[0:1025]
mXbark=mapping2bar
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



