Waveglow

部署运行你感兴趣的模型镜像

Github


waveglow gitbuh link


WaveGlow


用于语音合成的基于流的生成网络

一种基于流的网络,能够从梅尔谱图生成高质量的语音。WaveGlow 结合了Glow和WaveNet 的见解,以提供快速、高效和高质量的音频合成,无需自动回归。WaveGlow 仅使用单个网络实现,仅使用单个成本函数进行训练:最大化训练数据的可能性,这使得训练过程简单稳定。

我们的PyTorch实现在 NVIDIA V100 GPU 上以 1200 kHz 的速率生成音频样本。平均意见得分表明,它提供的音频质量与公开可用的最佳 WaveNet 实现一样好。


安装


git clone https://github.com/NVIDIA/waveglow.git
cd waveglow
git submodule init
git submodule update

安装要求 pip3 install -r requirements.txt

安装Apex(apex link


使用我们现有的模型生成音频


点击waveglow gitbuh link查看


训练你自己的模型


点击waveglow gitbuh link查看

您可能感兴趣的与本文相关的镜像

HunyuanVideo-Foley

HunyuanVideo-Foley

语音合成

HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值