音乐源分离项目教程
music_source_separation 项目地址: https://gitcode.com/gh_mirrors/mus/music_source_separation
1. 项目介绍
音乐源分离是指将音频记录分解为单独的源。本项目是一个基于PyTorch的音乐源分离实现。用户可以通过安装本项目将喜爱的歌曲分解为不同的源,还可以训练自己的源分离系统。本项目也适用于训练语音增强、乐器分离等分离系统。
2. 项目快速启动
环境准备
- 安装Python 3.7。注意:使用更高版本的Python可能会导致bytesep安装失败。建议使用conda(或其他环境管理工具)来管理包。
安装
运行以下命令安装bytesep:
pip install bytesep==0.1.1
分离音频
安装完成后,分离歌曲非常简单。在任何目录下执行以下命令:
python3 -m bytesep download_checkpoints
python3 -m bytesep separate \
--source_type="vocals" \
--audio_path="./resources/vocals_accompaniment_10s.mp3" \
--output_path="separated_results/output.mp3"
如果需要批量处理目录中的多个音频文件,可以使用以下命令:
python3 -m bytesep separate \
--source_type="vocals" \
--audio_path="audios_directory" \
--output_path="outputs_directory"
本项目当前支持的源类型包括“vocals”(人声)和“accompaniment”(伴奏)。用户还可以将本源分离系统嵌入到自己的程序中。具体示例见example.py
。
训练好的分离模型仅在Musdb18数据集(100首歌曲)上进行训练。训练好的检查点可以在这里下载:下载链接。
3. 应用案例和最佳实践
分离案例
以下是一个分离人声和伴奏的案例:
- 输入音频:含有混合人声和伴奏的歌曲
- 输出结果:分离出的人声和伴奏
训练自己的源分离系统
如果希望从头开始训练源分离系统,可以按照以下步骤操作:
-
下载数据集
执行以下脚本来下载和解压Musdb18数据集:
./scripts/0_download_datasets/musdb18.sh
-
将音频文件打包成hdf5文件
./scripts/1_pack_audios_to_hdf5s/musdb18/sr=44100,chn=2.sh
-
创建训练索引
./scripts/2_create_indexes/musdb18/create_indexes.sh
-
创建评估音频
./scripts/3_create_evaluation_audios/musdb18/create_evaluation_audios.sh
-
训练、评估和保存检查点
./scripts/4_train/musdb18/train.sh
-
使用用户训练的检查点进行分离
./scripts/5_separate/musdb18/separate.sh
4. 典型生态项目
本项目是基于PyTorch框架的,与以下开源项目类似或相关:
以上就是音乐源分离项目的使用教程,希望对您有所帮助。
music_source_separation 项目地址: https://gitcode.com/gh_mirrors/mus/music_source_separation
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考