百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

原创

已于 2023-10-08 09:35:33 修改 · 2.2k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2023-10-07 18:13:33 首次发布

本文详细记录了在Windows上使用Anaconda部署PaddleSpeech进行语音识别(ASR)和语音合成(TTS)的过程，包括安装Python、C++编译环境、创建虚拟环境、解决numpy与timer导入问题等常见问题。

前言

PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。

我在部署运行过程中，遇到很多问题，参考了很多资料，在这里做一个从安装部署到运行测试的、详尽的记录。

文章目录

官方给的要求如下

Python >= 3.7 (我这里使用Python3.9)
最新版本的 PaddlePaddle
C++ 编译环境 (win下，可通过Visual Studio Installer来安装)
提示: 我们建议在安装 paddlepaddle 的时候使用百度源 https://mirror.baidu.com/pypi/simple ，而在安装 paddlespeech 的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。

安装步骤略过，参考文章：anaconda的安装和使用

Anaconda Power Shell控制台中输入以下命令：

conda info

我的conda版本是23.1.0。

Anaconda Power Shell中输入以下命令，创建python版本为【3.9】、名为【paddle_speech】的虚拟环境。建议使用【Python3.9】，亲测可用。

conda env list
conda create -n paddle_speech python=3.9

激活 conda 虚拟环境：

conda activate paddle_speech