把音频中的不同音频源分离出来,是影音处理领域中的常用操作。
最普遍的需求就是把人声、背景音乐提取出来。
Spleeter 是开源的音频分离工具,分离效果非常好。
项目地址 github.com/deezer/spleeter
Spleeter 使用 TensorFlow 进行的机器学习,训练好了3种模型:
1)2 stems -- 人声、伴奏
2)4 stems -- 人声、鼓、贝斯、其他
3)5 stems -- 人声、鼓、贝斯、钢琴、其他
此外,Spleeter 也可以让你轻松的训练自己的模型。
下面是 Spleeter 的本地安装运行过程。
1. 安装依赖
必须先安装好 ffmpeg 和 libsndfile。
Spleeter 项目文档中是使用 conda 安装的。
建议使用 conda 安装,我刚开始没用 conda,折腾好久也没装好,后来使用 conda 一次就OK了
没装 conda 的,先去官网下载安装。
推荐安装 Anaconda,这个 conda 用于科学计算。它包含了 Vonda、Python 和超过 150 个科学软件包及其依赖项。
下载地址 anaconda.com/download