EdgeTTS-优快云博客

本文链接：https://blog.youkuaiyun.com/Jailman/article/details/146600491

EdgeTTS 是由微软开发的一款开源、免费且功能强大的文本转语音（TTS）工具，基于微软 Azure Cognitive Services 的语音合成技术。它支持多语言、多音色，并以自然流畅的语音输出为核心优势，适用于个人开发者和企业级应用。

在这里插入图片描述

一、核心功能与技术亮点

多语言与音色支持
EdgeTTS 支持 40+ 种语言 和 300+ 种音色，涵盖中文普通话、方言（如陕西话、台湾腔、粤语）、英语、日语等。例如：
- 中文音色：zh-CN-YunyangNeural（标准普通话）、zh-CN-shaanxi-XiaoniNeural（陕西方言）；
- 其他语言：日语 ja-JP-KeitaNeural、韩语 ko-KR-InJoonNeural 等。
高自然度语音合成
采用深度学习技术模拟人类语音韵律，生成接近真人发音的语音，适用于有声读物、视频旁白等场景。例如，中文语音合成的标点停顿和情感表达优于多数开源工具。
灵活的参数调节
支持通过命令行或代码调整语速（--rate）、音量（--volume）、音调（--pitch），例如：
```
edge-tts --rate=+30% --volume=-20% --text "欢迎使用EdgeTTS" --write-media output.mp3
```
语速范围为 ±50%，音调调节单位为 Hz（如 --pitch=+50Hz）。
跨平台与部署便捷性
- 命令行工具：支持 Windows/Linux/macOS，无需编程基础即可快速生成语音；
- Python API：集成异步编程接口，适合开发者嵌入应用程序；
- 浏览器端支持：通过 WebAssembly 和 Web Audio API 实现低延迟的网页端语音合成。

二、快速使用指南

安装方法
通过 Python 包管理器安装：
```
pip install edge-tts
```
或使用 pipx 隔离环境安装（推荐）：
```
pipx install edge-tts
```

基础命令示例

文本转语音：

edge-tts --voice zh-CN-YunyangNeural --text "2023年OpenAI发布GPT-4" --write-media speech.mp3

查看支持音色：
```
edge-tts --list-voices
```

实时试听：

edge-playback --text "Hello, world!" --voice en-US-AndrewNeural

编程接口调用

import edge_tts
import asyncio

async def generate_speech():
    text = "大家好，欢迎使用EdgeTTS！"
    voice = "zh-CN-YunyangNeural"
    communicate = edge_tts.Communicate(text, voice, rate="+10%")
    await communicate.save("output.mp3")

asyncio.run(generate_speech())