Segan_pytorch项目部署_generator.ckpt-优快云博客

本文链接：https://blog.youkuaiyun.com/Sky_QiaoBa_Sum/article/details/130343694

Segan_pytorch项目部署

该项目是SEGAN: Speech Enhancement Generative Adversarial Network 项目部署（Tensorflow）的Pytorch版本。

代码：https://github.com/santi-pdp/segan_pytorch

工具包：https://github.com/santi-pdp/ahoproc_tools

数据集：https://datashare.ed.ac.uk/handle/10283/1942

python3.6环境，接着按照requirements.txt安装

除此之外，还需要安装ahoproc_tools。

git clone https://github.com/santi-pdp/ahoproc_tools
cd ahoproc_tools
python setup.py install
# 可能会出错 Setup script exited with The 'sklearn' PyPI package is deprecated, use 'scikit-learn'
# 解决方法是，编辑setup.py，找到sklearn，换成scikit-learn即可

下载预先训练好的权重信息，链接： http://veu.talp.cat/seganp/release_weights/segan+_generator.ckpt

确保将segan+_generator.ckpt 放到ckpt_segan+目录下，run_segan+_clean.sh会去读取配置信息。

训练模型的脚本

!!! 需要注意的是，需要原始语音进行下采样到16kHz。

python train.py --save_path ckpt_segan+ --batch_size 300 \
		--clean_trainset data/clean_trainset \
		--noisy_trainset data/noisy_trainset \
		--cache_dir data/cache

使用预训练模型的脚本

python clean.py --g_pretrained_ckpt ckpt_segan+/<weights_ckpt_for_G> \
		--cfg_file ckpt_segan+/train.opts --synthesis_path enhanced_results \
		--test_files data/noisy_testset --soundfile

或者直接使用定义好的sh脚本，环境需要适当修改一下。