语音处理技术:从听觉研究到编码压缩
1. 人类听觉研究回顾
在深入探讨语音通信之前,先来回顾一下人类听觉的相关研究。人类听觉系统十分复杂,其物理结构和内部过程对声音的感知起着关键作用。然而,人类听觉系统并非总是按照声音物理特性所预测的方式运行,存在一些违反直觉的现象,这就引出了心理声学的概念。
心理声学通过多个实例进行了表征,还借助一些 Matlab 程序来展示其效果。例如,我们可以通过以下代码来重放不连续声音和连续声音:
soundsc(repmat(sa,1,8))
soundsc(repmat(sb,1,8))
2. 语音通信概述
语音通信主要涉及语音编码和压缩,而非语音分类和识别。为了更好地理解语音通信,我们可以将其处理过程分为几个关键步骤:
1. 量化 :将语音视为一般音频波形进行处理,不考虑语音的特性。
2. 参数化 :利用语音的特征和特性对语音信号进行参数化,进而进行源滤波器建模。
3. CELP 技术 :码本激励线性预测(CELP)语音压缩技术是这些方法的巅峰之作。
2.1 语音编码质量分类
语音压缩或编解码系统根据压缩对象(语音或一般音频)、压缩效果以及质量或可懂度进行分类。以下是常见的语音质量分类及其典型特征:
| 名称 | 采样率 | 带宽 | 动态范围 | 平均意见得分(MOS) |
| — | — | — | — | — | <
超级会员免费看
订阅专栏 解锁全文
2027

被折叠的 条评论
为什么被折叠?



