
声码器
Rookie羊
这个作者很懒,什么都没留下…
展开
-
PARALLEL WAVEGAN论文学习
Parallel Wavegan:基于具有多分辨率谱图的生成逆向网络的快速波形生成模型摘要:Parallel WaveGAN是一种无蒸馏的对抗生成网络,快速且占用空间小的波形生成方法。该方法通过联合优化多分辨率谱图和对抗损失函数来训练非自回归WaveNet,可以有效捕获真实语音波形的时频分布。由于我们的方法不需要在常规师生框架中使用密度蒸馏,因此即使使用少量参数,也可以轻松地训练整个模型。特别是,提出的Parallel WaveGAN仅具有1.44 M参数,并且在单个GPU环境下生成24 kHz语音波形的原创 2020-05-11 17:20:05 · 3660 阅读 · 0 评论 -
melGAN论文学习
MelGAN:用于条件波形合成的生成对抗网络摘要:先前的工作(Donahue等人,2018a; Engel等人,2019a)发现,利用GAN生成连续的原始音频波形具有挑战性。在本论文中,我们表明通过引入一组体系结构更改和简单的训练技术,可以可靠地训练GAN以生成高质量的连续波形。主观评估指标(平均意见得分,或MOS)显示了所提出的方法对于高质量Mel谱图反演的有效性。为了建立所提出技术的通用性...原创 2020-05-07 17:33:02 · 3153 阅读 · 3 评论