节拍检测:音乐与语音中的奥秘
在声音的世界里,节拍是一种至关重要的元素,它不仅存在于音乐中,也蕴含在语音里。本文将深入探讨节拍检测在音乐和语音领域的相关内容。
节拍检测面临的问题
在节拍检测的研究中,存在一些尚未解决的问题。在某些实验中,点击声与噪音起始的平均时间差在不同情况下有所不同,有20ms的差异,但目前还无法解释。
另外,现有的节拍检测方法大多是针对孤立的声音单元,而在日常生活中,连续的听觉单元在时间上并非清晰分离。例如,在流畅的语音中,连续音节的边界在声学和感知上都不明确;在音乐里,不同乐器演奏的音符可能会重叠,并且为了表达情感会有时间上的延迟或提前。这就导致连续或同时出现的听觉单元的节拍序列并非等时的。当听众被要求与非等时的音调序列同步时,他们的反应会比播放的音调序列更具等时性,这表明感知到的语音节奏与倾向于更等时的运动模式产生系统存在竞争。或许当找到节拍及其位置的神经生理学关联时,这个问题能够得到解决。
同时,还有一个疑问是,用孤立听觉单元测量得到的节拍位置,是否与这些听觉单元在流畅语音或现场音乐中的节拍位置相同。
音乐中的节拍
Schütte提出了一个简单的计算模型来估计音乐音调的节拍位置。其步骤如下:
1. 通过对整流后的声音信号进行低通滤波来估计时间包络。
2. 确定包络幅度的快速上升,即“瞬变”。
3. 估计的节拍位置是这些包络中最大值之前,达到最大值16%(即 -16 dB)的时刻。
Vos和Rasch对400Hz音调进行研究,Gordon对多位音乐家在多种不同乐器上演奏的16个音符进行研究,都得到了与Schütte类似的结果。他们还提出适应过
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



