9、听觉处理与场景分析：原理、实验与应用

z2a3b4c5d

于 2025-11-11 10:08:03 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏：语音与音频处理精要文章标签：心理声学听觉场景分析声音增强

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/z2a3b4c5d/article/details/155146772

语音与音频处理精要专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

听觉处理与场景分析：原理、实验与应用

1. 心理声学处理

1.1 声音增强技术

声音的振幅可以通过两种方式改变：一是为声音分配更多的信号功率，二是将声音成分扩展到更多的临界频带。这种关系使得我们可以通过添加相关频率成分来“增强”声音，而不会像直接放大基频那样在特定频率上造成能量过度集中。该技术可用于在局部噪声环境中增强被掩盖的语音共振峰。

1.2 时间掩蔽释放

刺激后时间掩蔽会使在响亮音调或脉冲之后立即出现的声音听起来不那么响亮。通过检测此类事件，并先进行初始增益提升，随后再进行衰减式放大，可以抵消这种掩蔽效应。进行这种处理可能需要了解听众耳朵处的准确振幅。对于更响亮的声音，还需考虑暂时性阈值偏移（TTS）。

1.3 掩蔽与双音抑制

当所需音调靠近振幅更高的掩蔽音调时，所需音调会被掩蔽。为缓解这种情况，可以对所需音调进行放大、添加谐波增强，或进行轻微频率偏移。若所需音调与其他音调存在谐波关系，频率偏移幅度通常不应超过约 3%。目前已有许多用于预测掩蔽效应以进行声音增强的技术，且效果良好。

1.4 相关噪声的利用

存在于多个临界频带中的调制噪声，可使听觉系统通过相关处理来降低其影响。因此，我们推测在频谱不重要部分引入频率偏移且幅度降低的噪声版本，可减少原噪声的影响。

1.5 双耳掩蔽

合理控制输入到听众双耳的信号，有助于提高感知的信噪比。对于受加性高斯白噪声污染的语音系统，向双耳输入反相语音，同时处于相同噪声场中，可降低噪声影响。

2. 听觉场景分析

2.1 概述

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。