AI进军B-Box界:输入20秒任意声音,还你一段定制的B-Box演奏

铜灵 编译整理
量子位 出品 | 公众号 QbitAI

640?wx_fmt=jpeg

最近,B-Box界来了一位新玩家。它不是人类,而是AI。

和人类玩家不同,只要你不打断AI B-Boxer Vid,它就永远不会累。而且它还有一个特殊技能:可以用任何声音合成B-Box。

也就是说,你任意输入几个声音——可能是随口发出的拟声词,也可能只是敲了下桌子,它都会自动处理成B-Box风的演奏。

无论输入的原始声音如何,最后的结果听起来总是像模像样的——


在上面这段视频中,主人公拍了拍自己的脸颊,还弹了弹一个塑料瓶。这些声音都被电脑的麦克风记录下来,然后输入至模型生成演奏。

从今以后,你也可以称自己是B-Boxer了,谁让Vid的简化版现在已经开放,可以自己动手录制自己的B-Box了。

640?wx_fmt=jpeg

只需20秒

德井直生(Nao Tokui)是Vid的创作人,也是九州大学的客座副教授及AI音乐创作初创公司Qosmo的CEO。

德井直生团队开发的这个Neural Beatboxer神经网络系统,只需收集一段20秒的音频,就可以定制出配套的鼓声包,之后自动将输入的声音与鼓声有节奏地排序,一个不会重样的B-Box演奏就出来了。

这项技术中用到了两种模型:先是卷积神经网络模型根据输入声音的声谱图,将里面不同音色分离出来。随后,循环神经网络模型生成创作做,这个模型是在谷歌Magenta预训练模型DrumsRNN改进后得到的。

640?wx_fmt=png

当谈到自己的技术时,德井直生表示还是以新奇好玩为主。

“从技术上讲,这个项目并不是全新的,并且系统的输出听起来永远不会像巴赫或甲壳虫乐队那样好,”德井直生在接受采访时说,“我的目的是为人类作曲家创作有趣、怪异、新奇的节奏,而这些可能是他们不容易想到的。”

在线生成

想合成你自己的B-Box,可以前往这个地址简单一试(温馨提示:需要用Chrome浏览器打开):

https://codepen.io/teropa/pen/JLjXGK

自己动手,丰衣足食~

作者系网易新闻·网易号“各有态度”签约作者

—  —

活动推荐

640?wx_fmt=jpeg

加入社群

量子位AI社群19群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值