8、声音场景与事件的声学和心理声学探秘

最新推荐文章于 2025-10-16 07:36:55 发布

元编程奶

最新推荐文章于 2025-10-16 07:36:55 发布

阅读量32

点赞数

CC 4.0 BY-SA版权

分类专栏：听见世界的算法文章标签：听觉系统声音识别声源速度估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b9c0d/article/details/152355181

听见世界的算法专栏收录该内容

48 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

声音场景与事件的声学和心理声学探秘

1. 听觉对声源速度的估计

听觉系统在估计物体速度方面有着独特的机制。有两种理论解释了听觉系统如何估计运动物体的速度。一种是通过在不同时刻估计声源的位置（即“快照”），然后比较移动的距离和所用时间。另一种则是利用直接指示方位（间接指示速度）的声学线索，如双耳时间差、多普勒频移和响度变化。心理声学研究证实，听众会利用这些不同的线索来判断声源速度。

当有明确信息时，听众会直接使用，比如冲击时的内摩擦系数、多普勒频移等。而当相关信息不完整时，他们可能会采用一些通常并非最优，但能提供大致近似的策略。

2. 声音识别的最小和稀疏特征

2.1 频谱区域、最短持续时间和频谱 - 时间调制

对于语音刺激，即使听觉刺激被严重扭曲和修改，仍可被识别。例如，使用噪声带声码器方法处理语音，语音依然可辨。近期，Gygi 等人将同样的技术应用于环境声音，确定了识别所需的重要频谱 - 时间区域。虽然效果不如语音显著，但研究表明，高度滤波的环境声音也能被识别，且识别所需的频率区域与语音相似，只是环境声音识别可能需要更多高频信息。不过，识别结果因环境声音的不同而有很大差异，这是由于环境声音的声学变异性较大。

为了避免研究环境声音的困难，Patterson 提出了脉冲 - 共振（如语音或旋律音乐）和噪声声音的有用区分。未来的研究可能会从这种区分中受益，因为不同类型的声音可能具有不同的特征。

许多研究通过对信号或任务施加多种约束，来系统地研究声音识别的有用特征。其中，时间约束（即门控）是一种常见的方法，主要应用于脉冲 - 共振声音（如语音和音乐）。例如，1942 年 Gray 提出的“音素显微切割”技术，他提取

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。