项目简介
文本到语音(TTS)是一种辅助技术,用于将以文本格式提供的自然语言转换为语音。具体来说,文本到语音系统会取用计算机(或其他数字设备)上写的文字,并将文本大声朗读出来。
OpenAI 的 TTS API 是一个端点,使用户能够与其文本到自然听起来的口语的 TTS AI 模型进行交互。该模型有两种变体:
TTS-1:最新的 AI 模型,为实时文本到语音使用案例优化。
TTS-1-HD:最新的 AI 模型,为质量优化。
该端点预置了六种声音,并且根据 OpenAI TTS 文档,可用于:
·朗读书面博客文章
·以多种语言制作口语音频
·使用流媒体进行实时音频输出
然而,需要注意的是,OpenAI 的使用政策要求用户向最终用户明确披露他们听到的 TTS 声音是由 AI 生成的,而不是人类的声音。
先决条件
一个有额度的OpenAI 账户
Python 3.7+
集成开发环境(IDE)
第一步:生成 API 密钥
登录您的 OpenAI 账户后,您将被引导到主屏幕。从这里,导航到页面左上角的 OpenAI 徽标以切换侧边栏。
选择“API 密钥”。


本文详细指导如何使用OpenAI的TTSAPI进行文本转语音,包括API的两个版本、获取API密钥、设置环境和实际代码示例,以及API的限制和价格信息。
最低0.47元/天 解锁文章
1336

被折叠的 条评论
为什么被折叠?



