【语音合成】CosyVoice 使用教程
【语音合成】CosyVoice 使用教程
CosyVoice 介绍
CosyVoice 是阿里通义实验室发布的开源多语言大语音生成模型,提供推理、训练和部署全栈能力。
CosyVoice 是依托大规模预训练语言模型,深度融合文本理解和语音生成的一项新型语音合成技术,能够精准解析并诠释各类文本内容,将其转化为宛如真人般的自然语音。
CosyVoice 采用了总共超 15 万小时的数据训练,支持中英日粤韩 5 种语言的合成,合成效果显著优于传统语音合成模型。
CosyVoice 用途
CosyVoice 专注于自然语音生成,支持多语言、音色和情感控制。
CosyVoice 能够根据少量原始音频快速生成模拟音色,包括韵律和情感细节。
CosyVoice 支持跨语种语音生成和细粒度的情感控制。
CosyVoice 使用
CosyVoice 预训练模型说明
CosyVoice-300M——基底模型
<