听觉处理与场景分析:原理、实验与应用
1. 心理声学处理
1.1 声音增强技术
声音的振幅可以通过两种方式改变:一是为声音分配更多的信号功率,二是将声音成分扩展到更多的临界频带。这种关系使得我们可以通过添加相关频率成分来“增强”声音,而不会像直接放大基频那样在特定频率上造成能量过度集中。该技术可用于在局部噪声环境中增强被掩盖的语音共振峰。
1.2 时间掩蔽释放
刺激后时间掩蔽会使在响亮音调或脉冲之后立即出现的声音听起来不那么响亮。通过检测此类事件,并先进行初始增益提升,随后再进行衰减式放大,可以抵消这种掩蔽效应。进行这种处理可能需要了解听众耳朵处的准确振幅。对于更响亮的声音,还需考虑暂时性阈值偏移(TTS)。
1.3 掩蔽与双音抑制
当所需音调靠近振幅更高的掩蔽音调时,所需音调会被掩蔽。为缓解这种情况,可以对所需音调进行放大、添加谐波增强,或进行轻微频率偏移。若所需音调与其他音调存在谐波关系,频率偏移幅度通常不应超过约 3%。目前已有许多用于预测掩蔽效应以进行声音增强的技术,且效果良好。
1.4 相关噪声的利用
存在于多个临界频带中的调制噪声,可使听觉系统通过相关处理来降低其影响。因此,我们推测在频谱不重要部分引入频率偏移且幅度降低的噪声版本,可减少原噪声的影响。
1.5 双耳掩蔽
合理控制输入到听众双耳的信号,有助于提高感知的信噪比。对于受加性高斯白噪声污染的语音系统,向双耳输入反相语音,同时处于相同噪声场中,可降低噪声影响。
超级会员免费看
订阅专栏 解锁全文
839

被折叠的 条评论
为什么被折叠?



