Segan_pytorch项目部署
该项目是SEGAN: Speech Enhancement Generative Adversarial Network 项目部署(Tensorflow)的Pytorch版本。
代码:https://github.com/santi-pdp/segan_pytorch
工具包:https://github.com/santi-pdp/ahoproc_tools
数据集:https://datashare.ed.ac.uk/handle/10283/1942
python3.6环境,接着按照requirements.txt安装
除此之外,还需要安装ahoproc_tools。
git clone https://github.com/santi-pdp/ahoproc_tools
cd ahoproc_tools
python setup.py install
# 可能会出错 Setup script exited with The 'sklearn' PyPI package is deprecated, use 'scikit-learn'
# 解决方法是,编辑setup.py,找到sklearn,换成scikit-learn即可
下载预先训练好的权重信息,链接: http://veu.talp.cat/seganp/release_weights/segan+_generator.ckpt
确保将segan+_generator.ckpt 放到ckpt_segan+目录下,run_segan+_clean.sh
会去读取配置信息。
训练模型的脚本
!!! 需要注意的是,需要原始语音进行下采样到16kHz。
python train.py --save_path ckpt_segan+ --batch_size 300 \
--clean_trainset data/clean_trainset \
--noisy_trainset data/noisy_trainset \
--cache_dir data/cache
使用预训练模型的脚本
python clean.py --g_pretrained_ckpt ckpt_segan+/<weights_ckpt_for_G> \
--cfg_file ckpt_segan+/train.opts --synthesis_path enhanced_results \
--test_files data/noisy_testset --soundfile
或者直接使用定义好的sh脚本,环境需要适当修改一下。