21、语音处理高级技术:LSP调整与语音音调变换

语音处理高级技术:LSP调整与语音音调变换

1. LSP调整技术

在语音处理中,线性预测谱对(LSP)调整是一项重要的技术。对于原始的LSP集合 lsp ,我们可以通过一定的度数 b (单位为Barks)进行偏移,从而得到一组偏移后的LSP集合 lsp2 。具体的偏移公式为:
[lsp2(n) = bark2f(f2bark(lsp(n)) + b)]
不过,并非需要对LSP集合中的每一条线都进行偏移,通常只需要对与特定共振峰直接相关的线进行操作。同时,为了防止LSP值接近角频率的极值(0或$\pi$),需要设置硬限制,并且要检查是否因两条线靠得太近而产生意外的共振。因为对连续语音频谱进行大幅度的改变很可能会导致语音质量下降。

1.1 处理复杂度

从处理复杂度的角度来看,LSP变窄操作每条线需要进行三次运算,对于典型的三共振峰帧则需要九次运算。使用公式(7.14)进行偏移时,每条线需要四次运算,对于十阶分析帧中的所有线进行偏移则需要40次运算。而使用公式(7.15)进行LSP偏移时,每条线大约需要六次运算,并且在实现时通常需要一个查找表。

我们也可以使用自适应滤波器技术来实现类似的共振峰处理效果。对于每个N样本的P阶分析帧,这种滤波器至少需要$2NP$次运算。在对240样本帧进行十阶分析时,这里讨论的LSP处理方法比自适应滤波器的效率高40到400倍。但这些数据仅在LSP数据可用的情况下有效(许多码激励线性预测(CELP)编码器就是这种情况)。如果LSP数据不可用,将线性预测系数(LPC)转换为LSP以及反向转换的开销将远远超过可能获得的效率提升。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值