文章目录
仅仅是学习一下思想,不需要重点关注,从实验结果来看,参考意义不大。
1. Noise prior knowledge learning for speech enhancement via gated convolutional generative adversarial network
1.1 摘要
当信噪比很低时,噪声占据主导地位,很难对纯净语音信号进行预测,本文提出了一种利用噪声先验知识的门控卷积神经网络SEGAN(Speech enhancement generative adversarial network),简写为GSEGAN。该模型不仅对纯净语音进行预测,而且学习噪声先验知识来辅助语音增强。门控CNN在捕获长期时序依赖方面具有比常规CNN更大的优势,本文在Voice Bank Corpus上对模型进行了评测。
1.2 语音增强生成对抗网络SEGAN
生成器G从一些已知的先验分布 p z ( z ) p_z(z) pz</