fmod实现声音波形_【脑洞向】用物理方法穷尽一切声响,编写一部“终极声音字典”!...

8ad97f23205f5841d46677f5d8dfff05.png

今天突然开了这个脑洞,下面对这个脑洞谈谈个人的看法,以此抛砖引玉。

我假想了一种理论模型,姑且命名为“终极声音字典”——它遍历了自然界所有声响的一切可能性。假设它存在,那么,打开任一段声音 / 音频文件(可以是世界上任何一首音乐、任何一段语音、自然界各种发出的声响……)等等,都可以在这个理论模型中找到它的“出处”。这个理论模型存在吗?如果存在,用何种方法实现?

从傅立叶理论,任何声音都可以分解为纯音(正弦波)的叠加。一个任意的有限长度的声音,数字化后都可以写成这样的函数形式:

(可简写为:

或:

(可简写为:

其中,

代表直流偏移,后面每个正弦项的系数
和余弦项的系数
(或:振幅系数
和相位
)塑造了这段周期性声音信号的特征。

那么,我们就可以用类似“音集”的方式表示一个周期性声音波形。例如下面这个波形:

d379570236aec1ec46b65c88a6e70855.png

(中间的竖线间隔该波形的周期。)当这个函数的项数越来越多,波形就越来越复杂,周期也越来越长。傅立叶级数是一个无穷级数,也就是说,世界上任何一段音频都可以用这个级数来逼近,只要项数足够多。

用在二维平面上,就像是这个例子:“川普曲线”——和它的解析式。

cee9a6abb2dc3ed9a03b1d1e2c2f609c.png

6a0e780f1893cd07104f98dc35be7f73.png

可见,用这个级数,只要解析式的项数足够多,任何图形都可以画出来。

回到上面举的波形:

c06ea203449b90e4d0dc68373b822eb9.png

它的解析式是:

这个式子,我们就“提取”出当中的各项系数,用“音集”的方式写成:

这就为声音波形建立了“音集”,一个特征的波形只会对应唯一的“音集”。

(关于“音集”理论,可以参考此文:小议如何将音集理论推广至所有微分音以至于频谱音乐)

然而,傅立叶级数是一个无穷级数,也意味着如果要遍历所有声音,项数将趋于无穷,这是不可能的。

但是即使如此,仍然有希望:例如,一段采样率为44100Hz的音频(CD音质)在人耳听觉已经没什么失真。因此,在未来,我们也许可以如此遍历一切声响,把一切声响记录为:

的形式,从而完成这部“终极声音辞典”的构建。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值