win本地部署文字转语音tts

本文介绍了在Windows本地环境下部署CoquiTTS进行文字转语音的技术,包括环境配置(如Python3.9及以上、PyTorch等)、安装步骤、模型选择以及使用方法,还提供了PythonAPI示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

win本地部署文字转语音tts


Mozilla TTS 已经停止更新,所以这里用 Coqui TTS , coqui官网开源地址

git clone https://github.com/coqui-ai/TTS

1.环境

conda create -n t python==3.9#要大于等于3.9
conda activate t
conda install --no-cache-dir pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
pip install -r requirements.txt
python setup.py install#这里如果遇到问题,就去https://visualstudio.microsoft.com/visual-cpp-build-tools/安装一下C++build tools

2.使用

tts --list_models#测试tts是否安装成功,输出模型的信息
tts --model_info_by_name tts_models/tr/common-voice/glow-tts#查看模型信息
tts --text "text for TTS" --out_path ./test_speech.wav#将字符串输出语音,这时会下载模型,如果模型下载失败,去用户的AppData\Local\目录下手动删除tts目录,再次尝试

中文语音:可以去https://github.com/coqui-ai/TTS/releases/tag/v0.6.1_models下载里面的https://github.com/coqui-ai/TTS/releases/download/v0.6.1_models/tts_models–zh-CN–baker–tacotron2-DDC-GST.zip解压后放在用户目录的\AppData\Local\tts文件夹里面。然后使用这个中文模型测试。

tts --text "知是行之始,行是知之成。" --out_path aaa.wav --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST

python引用

from TTS.api import TTS
tts=TTS("tts_models/zh-CN/baker/tacotron2-DDC-GST")
tts.tts_to_file(text="知是行之始,行是知之成。", file_path="aaa.wav")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是小z呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值