EmotiVoice:多音色提示控制TTS引擎
项目基础介绍和主要编程语言
EmotiVoice 是一个功能强大的开源文本转语音(TTS)引擎,由网易有道出品。该项目主要使用 Python 语言进行开发,适合对语音合成技术感兴趣的开发者学习和使用。
项目核心功能
- 多语言支持:EmotiVoice 支持中英文双语,能够生成高质量的语音输出。
- 多音色选择:提供超过2000种不同的音色,满足各种应用场景的需求。
- 情感合成:支持情感合成功能,可以生成包含快乐、兴奋、悲伤、愤怒等多种情感的语音。
- 易用接口:提供易于使用的网页界面和脚本接口,方便用户进行批量生成和定制化操作。
项目最近更新的功能
- 语音速度调节:在 'OpenAI-compatible-TTS API' 中新增了语音速度调节功能,感谢 @john9405 的贡献。
- Mac 应用发布:EmotiVoice 的 Mac 应用于2023年12月28日发布,用户可以直接下载体验。
- HTTP API 发布:EmotiVoice HTTP API 于2023年12月6日发布,提供更便捷的使用体验和超过13,000次免费调用。
- 语音克隆:支持使用个人数据进行语音克隆,于2023年12月13日发布,并提供了 DataBaker 和 LJSpeech 的配方。
通过这些更新,EmotiVoice 进一步提升了其易用性和功能丰富性,为用户提供了更加灵活和强大的语音合成工具。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



