NBSS 项目下载及安装教程
NBSS 项目地址: https://gitcode.com/gh_mirrors/nb/NBSS
1、项目介绍
NBSS(Narrow-band Conformer & SpatialNet)是一个用于多通道语音分离、降噪和去混响的开源项目。该项目由Westlake大学的音频研究团队开发,旨在提供先进的语音处理技术。NBSS项目包含了多个模型,如NBC和SpatialNet,这些模型在多通道语音分离、降噪和去混响任务中表现出色。
2、项目下载位置
你可以通过以下链接访问NBSS项目的GitHub仓库并下载项目:
3、项目安装环境配置
在安装NBSS项目之前,你需要确保你的系统环境满足以下要求:
- Python 3.7 或更高版本
- PyTorch 1.8 或更高版本
- CUDA(如果使用GPU)
环境配置步骤
-
安装Python: 确保你的系统上安装了Python 3.7或更高版本。你可以通过以下命令检查Python版本:
python --version
-
安装PyTorch: 你可以通过以下命令安装PyTorch(根据你的CUDA版本选择合适的命令):
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
-
安装依赖包: 进入项目目录后,运行以下命令安装项目所需的依赖包:
pip install -r requirements.txt
环境配置示例
以下是环境配置的示例图片:
4、项目安装方式
克隆项目
首先,你需要克隆NBSS项目的GitHub仓库到本地:
git clone https://github.com/Audio-WestlakeU/NBSS.git
安装项目
进入项目目录后,运行以下命令安装项目:
cd NBSS
pip install -e .
5、项目处理脚本
NBSS项目提供了多个处理脚本,用于生成数据集、训练模型和测试模型。以下是一些常用的脚本:
生成数据集
python generate_rirs.py --rir_dir ~/datasets/SMS_WSJ_Plus_rirs --save_to configs/datasets/sms_wsj_rir_cfg.npz
训练模型
python SharedTrainer.py fit \
--config=configs/SpatialNet.yaml \
--config=configs/datasets/sms_wsj_plus.yaml \
--model.channels=[0,1,2,3,4,5] \
--model.arch.dim_input=12 \
--model.arch.dim_output=4 \
--model.arch.num_freqs=129 \
--trainer.precision=bf16-mixed \
--model.compile=true \
--data.batch_size=[2,4] \
--trainer.devices=0 \
--trainer.max_epochs=100
测试模型
python SharedTrainer.py test \
--config=logs/SpatialNet/version_x/config.yaml \
--ckpt_path=logs/SpatialNet/version_x/checkpoints/epochY_neg_si_sdrZ.ckpt \
--trainer.devices=0
通过以上步骤,你可以成功下载、安装并运行NBSS项目。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考