阶跃星辰开源的文本转语音模型
Step-Audio-TTS-3B
现已上线模力方舟 Serverless API,访问以下连接即可体验使用:https://ai.gitee.com/serverless-api?model=Step-Audio-TTS-3B
Step-Audio-TTS-3B
是业界首个基于大规模合成数据集并采用 LLM-Chat 范式训练的文本转语音(TTS)模型。该模型在SEED TTS Eval
基准测试中取得了SOTA(最先进的)字符错误率成绩。
内容一致性的表现对比中,Step-Audio-TTS-3B
的中英文 CER(字符错误率)和 WER(词错误率)均表现出色
Step-Audio-TTS-3B
支持多种语言、丰富的情感表达以及多样的语音风格控制。特别值得注意的是,Step-Audio-TTS-3B
也是业界首个能够生成说唱和哼唱的 TTS 模型。



点击文末阅读原文,前往模力方舟体验Step-Audio-TTS-3B
吧!