神曲背后的故事:算法工程师带你理性解构“蚂蚁呀嘿”

简介:前几天小伙伴们是不是都被魔性的「蚂蚁呀嘿」刷屏了?其实背后的技术含量并不复杂,主要依靠的是换脸技术和自动节奏检测,算法会找到节奏点,在这些节奏点摇脸换表情,这样一支魔性而上头短视频就诞生了。今天为大家一一解构那些网络神曲,分享音乐信息检索算法,带你理性看神曲,或许下一个网络神曲缔造者就是你!

作者:意姝
审核:泰一

什么是音乐?

《礼记》里说,“凡音者,生人心者也,情动于中,形于声,声成文,谓之音”,音是表情达意的一种方式。从乐理上讲,通常音乐是由节奏、旋律、和声这三要素构成的,十二平均律这些律式和数学紧密相关。所以我们可以说,音乐是一个感性与理性交融的产物。而今天要介绍的音乐信息检索(Music Information Retrieval,MIR),便是从音乐里提取 “信息” ,用算法将音乐中理性的一面挖掘出来。

哪些是音乐的信息?

1. 节奏

首先我们来听一首抖音神曲:《鳌拜鳌拜鳌拜拜》

https://y.qq.com/n/yqq/song/000ZCScz4g4BuM.html


歌曲中让你忍不住跟着一起摇头抖腿的强烈的鼓点,就是节奏点,这是对节奏一种感性的认知。


严格来说,节奏是被组织起来的音的长短关系,它像是音乐的骨架,把音乐支撑了起来。譬如下图乐谱上的 “4/4” 是拍号,代表着这首曲子的音长的组织形式为:以四分音符为一拍,每小节 4 拍。每小节的第一拍往往为强拍(downbeat),这里的 “down” 和指挥的手势一致。


其它常见的拍号还有:2/4,3/4 等,这些都是单拍子(simple meter),也就是每拍自然二等分的节拍。除此之外还有复拍子(compound meter),指的是每拍自然三等分的节拍,如 6/8,复二拍子,读作 “一二三,二二三,一二三,二二三” 。

image.png

爵士乐、灵魂乐的魅力很多都在于对节奏的运用,遗憾的是,相当一部分华语流行歌曲都是 4/4 拍子的,导致听感上有很多雷同之处。

 2. 音高

音乐是一种声音,所以也是由物体震动产生的,音的高低是由振动频率决定的。乐器发出的声音或人声,一般都不会只包含一个频率,而是可以分解成若干个不同频率的音的叠加。


这些频率都是某一频率的倍数,这一频率就称作基频,也就决定了这个音的音高。下图为一段男声朗读的音频的语谱图,最下面蓝色框出来的部分就是当前时

评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值