NBSS 项目下载及安装教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01259/article/details/143039370

NBSS 项目下载及安装教程

NBSS 项目地址: https://gitcode.com/gh_mirrors/nb/NBSS

1、项目介绍

NBSS（Narrow-band Conformer & SpatialNet）是一个用于多通道语音分离、降噪和去混响的开源项目。该项目由Westlake大学的音频研究团队开发，旨在提供先进的语音处理技术。NBSS项目包含了多个模型，如NBC和SpatialNet，这些模型在多通道语音分离、降噪和去混响任务中表现出色。

2、项目下载位置

你可以通过以下链接访问NBSS项目的GitHub仓库并下载项目：

NBSS项目GitHub仓库

3、项目安装环境配置

在安装NBSS项目之前，你需要确保你的系统环境满足以下要求：

Python 3.7 或更高版本
PyTorch 1.8 或更高版本
CUDA（如果使用GPU）

环境配置步骤

安装Python：确保你的系统上安装了Python 3.7或更高版本。你可以通过以下命令检查Python版本：
```
python --version
```
安装PyTorch：你可以通过以下命令安装PyTorch（根据你的CUDA版本选择合适的命令）：
```
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
```
安装依赖包：进入项目目录后，运行以下命令安装项目所需的依赖包：
```
pip install -r requirements.txt
```

环境配置示例

以下是环境配置的示例图片：

环境配置示例

4、项目安装方式

克隆项目

首先，你需要克隆NBSS项目的GitHub仓库到本地：

git clone https://github.com/Audio-WestlakeU/NBSS.git

安装项目

进入项目目录后，运行以下命令安装项目：

cd NBSS
pip install -e .

5、项目处理脚本

NBSS项目提供了多个处理脚本，用于生成数据集、训练模型和测试模型。以下是一些常用的脚本：

生成数据集

python generate_rirs.py --rir_dir ~/datasets/SMS_WSJ_Plus_rirs --save_to configs/datasets/sms_wsj_rir_cfg.npz

训练模型

python SharedTrainer.py fit \
  --config=configs/SpatialNet.yaml \
  --config=configs/datasets/sms_wsj_plus.yaml \
  --model.channels=[0,1,2,3,4,5] \
  --model.arch.dim_input=12 \
  --model.arch.dim_output=4 \
  --model.arch.num_freqs=129 \
  --trainer.precision=bf16-mixed \
  --model.compile=true \
  --data.batch_size=[2,4] \
  --trainer.devices=0 \
  --trainer.max_epochs=100

测试模型

python SharedTrainer.py test \
  --config=logs/SpatialNet/version_x/config.yaml \
  --ckpt_path=logs/SpatialNet/version_x/checkpoints/epochY_neg_si_sdrZ.ckpt \
  --trainer.devices=0

通过以上步骤，你可以成功下载、安装并运行NBSS项目。

NBSS 项目地址: https://gitcode.com/gh_mirrors/nb/NBSS

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考