
项目地址:
https://github.com/alibaba-damo-academy/FunCodec
https://modelscope.cn/models/damo/speech_synthesizer-laura-en-libritts-16k-codec_nq2-pytorch/summary
LauraTTS:
https://github.com/alibaba-damo-academy/FunCodec/tree/master/egs/LibriTTS/text2speech_laura
| testset |
WER |
Ins |
Del |
Sub |
Speaker Simi |
| LibriTTS test-clean |
3.01 |
15 |
51 |
200 |
83.53 |
| VALL-E |
16.14 |
142 |
148 |
1137 |

本文介绍了阿里巴巴达摩院开源的音频处理工具包FunCodec,特别是其在LibriTTS上的预训练模型LauraTTS,具备零样本说话人自适应和高质量语音合成能力。文章详细讲解了模型结构、使用方法以及如何通过ModelScope进行语音合成操作。
最低0.47元/天 解锁文章
1282

被折叠的 条评论
为什么被折叠?



