当AI技术与语音合成相遇,开源技术众多,为什么 ChatTTS 能够一夜爆火?你有听说过能说情感真切文字的 AI 吗?

前言
想象一下,你只需输入一句话,AI就能念得声情并茂,不仅支持中英文混读,还能克隆声音,甚至在合适的地方加入语气词和停顿,听起来如同真人一般。
这并不是科幻小说中的场景,而是如今已经实现的技术。
近期,一款名为 ChatTTS 的开源文本转语音(TTS)工具一夜爆火,引起了广泛关注,现如今GitHub标星量已突破 24.1k。
它究竟有何魅力,能在行业内外引起如此轰动呢?
ChatTTS 介绍
ChatTTS,一个专为对话场景设计的文本转语音(TTS)模型,特别适用于大语言模型(LLM)助手对话任务、对话语音生成以及视频介绍等应用场景。
它不仅支持中英文混合文本的语音合成,更重要的是,音色表现极其逼真,几乎达到了真假难辨的程度。
与字节跳动最新推出的LLM语音合成工具相比,ChatTTS在音质之外的各个方面表现更为出色。
这个项目在GitHub上一夜爆火,引起了广泛的关注和讨论。
该模型经过了超过10万小时的中英文数据训练,目前在HuggingFace上开源的版本为经过4万小时训练且未进行后续微调的版本。
特色功能:
-
中英文混读: 无论是中文还是英文,ChatTTS都能流畅地进行语音合成,且能够在一句话中实现两种语言的自然切换。
-
情感表达: ChatTTS

最低0.47元/天 解锁文章
1430

被折叠的 条评论
为什么被折叠?



