31、音色感知的维度分析

最新推荐文章于 2025-08-21 13:50:38 发布

code8

最新推荐文章于 2025-08-21 13:50:38 发布

阅读量89

点赞数

CC 4.0 BY-SA版权

分类专栏：探索声音感知的科学奥秘文章标签：音色感知共振峰元音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/code8/article/details/150434492

探索声音感知的科学奥秘专栏收录该内容

88 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

音色感知的维度分析

1. 音色感知及维度分析概述

音色被定义为既非响度、亦非音高和时长的声音听觉属性，这使得难以定义简单的声学关联来描述它。而且，用于描述声音的词汇众多，表明音色空间并非一维甚至低维的。鉴于非线性、迟滞和上下文效应，涵盖所有可能音色的通用音色空间可能根本不存在度量。不过，某些类别的声音子空间可近似为有限维度的空间。

计算这些空间需要复杂的程序，主要技术包括：
- 频谱图 ：1945 年引入，可用于元音和乐器声音等的分析。
- 多维标度法（MDS） ：用于研究音色空间。
- 声音的语言属性分析 ：辅助对音色的研究。

下面将重点讨论元音声音和乐器声音的音色子空间，这里先着重阐述元音声音的音色空间。

2. 元音声音的音色空间

2.1 元音的频谱 - 时间分析与共振峰

随着频谱图的出现，对口语元音进行频谱 - 时间分析成为可能。频谱图能清晰显示变化的共振峰，即声道的共振，表现为“在模式中穿梭的暗带”。共振峰通常按频率从低到高编号为 F1、F2、F3 等。可以将人类声道建模为半开管来描述共振峰，若半开管各处横截面积相等，其共振频率可表示为((2k - 1) c / (4L))（(k = 1, 2, 3, \cdots)），其中(c)是声速，(L)是管道长度。男性声道长度约 17 厘米，女性约 13 厘米，因此男性声道的共振频率是 500 Hz 的奇数倍，女性是 660 Hz 的奇数倍。当横截面积不同时，共振频率会相应改变，在人类语音中，这是由于发音器官（如颌、舌和唇

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。