TTS Azure Web-微软文本转语音-语音合成一键部署

简介:

TTS Azure Web 是一个 Azure 文本转语音(TTS)网页应用。通过语音合成标记语言 (SSML) 对输出语音结果微调,可以在本地运行或使用你的 Azure Key 一键部署。

主要特性:

  • 支持选择语音、语言、风格和角色
  • 支持语速、语调、音量的调节
  • 支持输出音频下载
  • 本地和云端一键部署。
  • 支持导入/导出 SSML 配置

该项目适合那些希望在体验 Azure TTS 全功能的同时最小化设置工作的用户。

在线演示: https://tts.femoon.top/cn

开源地址:https://github.com/Femoon/tts-azure-web/blob/main/README_CN.md

入门指南

获取你的 API 密钥

  • 需要一张 VISA 卡
  • 访问 Microsoft Azure 文本转语音 并点击“免费试用文本转语音”
  • 访问 Azure AI services
  • 在“语音服务”块中,点击“创建”
  • 创建成功后,在语音服务旁边将列出一个区域和两个订阅 Key 。你只需一个 Key 及其对应的区域

具体可以参考 Bob 官方申请 Azure TTS 的图文教程,流程只需要到获取完密钥就可以了。

开发

在开始开发之前,必须在项目根目录创建一个新的 .env.local 文件,并输入你的 Azure Key 和对应的地区:

# 你的 Azure Key (必填)
SPEECH_KEY=your_azure_key
# 你的 Azure 地区 (必填)
SPEECH_REGION=your_azure_region
# 输入框最大长度限制 (可选)
NEXT_PUBLIC_MAX_INPUT_LENGTH=4000

本地运行开发服务器:

# 安装 yarn
npm i -g yarn
# 安装依赖
yarn
# 运行服务器
yarn dev

在本地一键部署

# 安装 yarn
npm i -g yarn
# 安装依赖
yarn
# 构建生产环境
yarn build
# 运行生产环境服务
yarn start

使用浏览器打开 http://localhost:3000 查看结果。

注意:国内服务器拉取依赖可能会失败,最好用外面的服务器测试。

### 如何在Python中集成Azure TTS API 要在Python中集成Azure文本语音TTS)服务,可以选择多种方法实现这一目标。以下是几种常见的方案及其具体操作方式。 #### 使用官方Azure SDK 通过安装并配置Azure认知服务的语音SDK来使用其功能是最常见的方式之一。可以运行以下命令完成安装: ```bash pip install azure-cognitiveservices-speech ``` 之后,在代码中初始化`SpeechConfig`对象,并设置API密钥以及对应的服务区域[^1]。下面是一段简单的示例代码展示如何合成语音文件: ```python import azure.cognitiveservices.speech as speechsdk def synthesize_speech(text, subscription_key, region): speech_config = speechsdk.SpeechConfig(subscription=subscription_key, region=region) audio_output_config = speechsdk.audio.AudioOutputConfig(use_default_speaker=True) synthesizer = speechsdk.SpeechSynthesizer(speech_config=speech_config, audio_config=audio_output_config) result = synthesizer.speak_text_async(text).get() if result.reason == speechsdk.ResultReason.SynthesizedAudio: print("成功合成了音频") elif result.reason == speechsdk.ResultReason.Canceled: cancellation_details = result.cancellation_details print(f"错误:{cancellation_details.error_details}") synthesize_speech("你好世界", "<your-subscription-key>", "<your-region>") ``` 此代码片段展示了如何利用Azure Speech SDK将一段文字换成声音并通过默认扬声器播放出来。 #### 使用第三方库 `aspeak` 对于更简洁的操作需求,还可以考虑采用专门封装好的工具包——例如`aspeak`。这是一个针对Azure TTS接口设计得更加友好的客户端程序。要开始使用它,请先执行如下指令将其加入当前环境中: ```bash pip install -U aspeak==6.0.0 ``` 接着按照文档说明调用相应函数即可快速生成所需的声音数据流或者保存至本地磁盘上的mp3/wav等格式文件之中[^2]: ```python from aspeak import TextToSpeech tts_client = TextToSpeech("<your-subscription-key>", voice="zh-CN-XiaoxiaoNeural") async def main(): await tts_client.save_to_file( text="这是一条测试消息。", path="./output.mp3" ) if __name__ == "__main__": import asyncio loop = asyncio.get_event_loop() try: loop.run_until_complete(main()) finally: loop.close() ``` 上述脚本定义了一个异步任务用于把指定字符串化为普通话发音版本存储起来供后续处理用途. #### 关于Edge-TTS模块的选择 值得注意的是,虽然存在另一个名为`edge-tts` 的开源项目能够提供相似的功能支持,但它并不依赖实际部署有Microsoft Edge实例才能正常运作;相反地,它是借助网络请求访问远程服务器端点达成目的而已[^4].因此如果单纯为了获取高质量的人工智能朗读效果而无需额外定制化选项的话,则可以直接选用此类轻量级解决方案试试看吧! ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值