7、语音与听觉知识解析

语音与听觉知识解析

1. 语音相关知识

语音信号有着诸多物理特性,如振幅、频率分布、节奏等。语音的基本单位包括音素、单词和句子,它们共同承担着信息传递的功能。

词汇量对语音可懂度有着显著影响。通过相关实验可知,当人为限制词汇量或借助上下文来约束词汇量时,语音识别率会大幅提高。例如,在 -9 dB 的信噪比水平下,将词汇量从 256 减少到 16,能使识别的单词数量增加近四倍。不过需要注意的是,这里所提到的清晰度指数衡量的是单个音素的识别率,而非单词本身。

2. 听觉的物理过程

人类听觉的感知过程包含多个非线性阶段,这导致我们主观感受到的声音特征与实际物理声音存在明显差异。下面为大家详细介绍听觉的物理过程:
- 声音传入 :耳朵的耳廓会对声音进行过滤,并将其聚焦到外耳道。声音随后作用于鼓膜,再通过锤骨、砧骨和镫骨这三块骨头的传递和放大,到达通向耳蜗的卵圆窗。
- 耳蜗结构 :耳蜗是一个呈螺旋状的管道,内部有一对大约 35 毫米长的半刚性膜(基底膜和前庭膜),它们被包裹在一种叫做内淋巴的液体中。基底膜上分布着柯蒂氏器官,每个器官中包含两排毛细胞(约 3500 个内毛细胞和 20000 个外毛细胞)。
- 频率选择性 :当毛细胞受到拉力时,会产生小的电脉冲,通常在周围液体振荡的稀疏部分引发听觉反应。基底膜的宽度和刚度沿其长度逐渐变化,因此当系统受到振动时,基底膜上发生共振的位置取决于频率,这为耳朵提供了一定的频率选择性。
- 大脑处理 :神经将电脉冲从耳朵传入大脑,在大脑中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值