百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)
前言
PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。
我在部署运行过程中,遇到很多问题,参考了很多资料,在这里做一个从安装部署到运行测试的、详尽的记录。
文章目录
文章目录
- 前言
- 先决条件
- 运行环境搭建
-
- 安装Anaconda
-
- 安装过程
- 查看conda版本
- 项目部署
-
- 为PaddleSpeech创建专属虚拟环境
- 安装 C++ 编译环境
- 安装PaddleSpeech
-
- 安装pytest-runner
- 安装paddlepaddle
- 安装paddlespeech
- 新建PaddleSpeech工作文件夹
- 快速上手
-
- 自动语音识别ASR(Automatic Speech Recognition)
-
- 准备测试音频
- 语音识别
- 运行报错及解决
- 重新识别
- 语音合成TTS(Text-to-Speech)(本文转语音)
-
- 语音合成
- 运行报错及解决
- 重新合成语音
- 关于日志
- 快速使用服务
-
- 启动服务
-
- 准备启动服务的配置文件
- 引用:
先决条件
官方给的要求如下
- Python >= 3.7 (我这里使用Python3.9)
- 最新版本的 PaddlePaddle
- C++ 编译环境 (win下,可通过Visual Studio Installer来安装)
- 提示: 我们建议在安装
paddlepaddle
的时候使用百度源 https://mirror.baidu.com/pypi/simple ,而在安装paddlespeech
的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。
运行环境搭建
安装Anaconda
安装过程
安装步骤略过,参考文章:anaconda的安装和使用
查看conda版本
Anaconda Power Shell控制台中输入以下命令:
conda info
我的conda版本是23.1.0。
项目部署
为PaddleSpeech创建专属虚拟环境
Anaconda Power Shell中输入以下命令,创建python版本为【3.9】、名为【paddle_speech】的虚拟环境。建议使用【Python3.9】,亲测可用。
conda env list
conda create -n paddle_speech python=3.9
激活 conda 虚拟环境:
conda activate paddle_speech