10、语音处理技术：从听觉研究到编码压缩

最新推荐文章于 2025-12-17 12:42:59 发布

z2a3b4c5d

最新推荐文章于 2025-12-17 12:42:59 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：语音与音频处理精要文章标签：语音处理心理声学语音编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z2a3b4c5d/article/details/155146776

语音与音频处理精要专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语音处理技术：从听觉研究到编码压缩

1. 人类听觉研究回顾

在深入探讨语音通信之前，先来回顾一下人类听觉的相关研究。人类听觉系统十分复杂，其物理结构和内部过程对声音的感知起着关键作用。然而，人类听觉系统并非总是按照声音物理特性所预测的方式运行，存在一些违反直觉的现象，这就引出了心理声学的概念。

心理声学通过多个实例进行了表征，还借助一些 Matlab 程序来展示其效果。例如，我们可以通过以下代码来重放不连续声音和连续声音：

soundsc(repmat(sa,1,8))
soundsc(repmat(sb,1,8))

2. 语音通信概述

语音通信主要涉及语音编码和压缩，而非语音分类和识别。为了更好地理解语音通信，我们可以将其处理过程分为几个关键步骤：
1. 量化：将语音视为一般音频波形进行处理，不考虑语音的特性。
2. 参数化 ：利用语音的特征和特性对语音信号进行参数化，进而进行源滤波器建模。
3. CELP 技术 ：码本激励线性预测（CELP）语音压缩技术是这些方法的巅峰之作。

2.1 语音编码质量分类

语音压缩或编解码系统根据压缩对象（语音或一般音频）、压缩效果以及质量或可懂度进行分类。以下是常见的语音质量分类及其典型特征：
| 名称 | 采样率 | 带宽 | 动态范围 | 平均意见得分（MOS） |
| — | — | — | — | — | <

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。