ChatTTS做为最近一款爆火的将文本转换为语音的开源工具,在语音合成方面有着诸多优势,目前有较多的网络视频以此在创作
开源地址:https://github.com/2noise/ChatTTS
目前该模型仅支持中文和英文对话,超过10万小时的数据训练,能够输出较高质量和多类型的语音,该模型从5月28日上线开源以来,目前在github上面已经收获25.3k Star;
ChatTTS的能够自然且富有表现力的合成语音,并且支持多个说话人进行互动对话;并且生成的语音自然流畅,能够控制停顿和笑声等动作;开发者介绍该模型进行了100,000+ 小时的中文和英文音频数据进行训练;
根据开发者提供的信息,目前是开源了4万小时基础模型和 spk_stats 文件,未来将做到开源 VQ 编码器和 Lora 训练代码,以及无需细化文本即可进行流式音频生成,开源具有多情感控制功能的 4 万小时版本,未来该团队可能会开源更多功能的ChatTTS模型;
并且已有社区成员基于此开源版本制作了便于使用的WEB UI界面和部署教程,不用繁琐的本地部署,降低了使用门槛,地址如下:https://huggingface.co/spaces/lenML/ChatTTS-Forge
大家可以尝试使用下