百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

本文详细记录了在Windows上使用Anaconda部署PaddleSpeech进行语音识别(ASR)和语音合成(TTS)的过程,包括安装Python、C++编译环境、创建虚拟环境、解决numpy与timer导入问题等常见问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

百度飞桨语音PaddleSpeech在win上运行语音识别(ASR)与语音合成(TTS)

前言

PaddleSpeech是PaddlePadle百度飞桨深度学习框架下的语音服务工具包。PaddleSpeech包括自监督学习模型、带标点符号的 SOTA/流式 ASR、带文本前端的流式 TTS、说话人验证系统、端到端语音翻译和关键字识别。

我在部署运行过程中,遇到很多问题,参考了很多资料,在这里做一个从安装部署到运行测试的、详尽的记录。

文章目录

文章目录

  • 前言
  • 先决条件
  • 运行环境搭建
    • 安装Anaconda
      • 安装过程
      • 查看conda版本
  • 项目部署
    • 为PaddleSpeech创建专属虚拟环境
    • 安装 C++ 编译环境
    • 安装PaddleSpeech
      • 安装pytest-runner
      • 安装paddlepaddle
      • 安装paddlespeech
      • 新建PaddleSpeech工作文件夹
  • 快速上手
    • 自动语音识别ASR(Automatic Speech Recognition)
      • 准备测试音频
      • 语音识别
      • 运行报错及解决
      • 重新识别
    • 语音合成TTS(Text-to-Speech)(本文转语音)
      • 语音合成
      • 运行报错及解决
      • 重新合成语音
    • 关于日志
  • 快速使用服务
    • 启动服务
      • 准备启动服务的配置文件
  • 引用:

先决条件

官方给的要求如下

  • Python >= 3.7 (我这里使用Python3.9)
  • 最新版本的 PaddlePaddle
  • C++ 编译环境 (win下,可通过Visual Studio Installer来安装)
  • 提示: 我们建议在安装 paddlepaddle 的时候使用百度源 https://mirror.baidu.com/pypi/simple ,而在安装 paddlespeech 的时候使用清华源 https://pypi.tuna.tsinghua.edu.cn/simple 。

运行环境搭建

安装Anaconda

安装过程

安装步骤略过,参考文章:anaconda的安装和使用

查看conda版本

Anaconda Power Shell控制台中输入以下命令:

conda info

image-20230511144649746

我的conda版本是23.1.0。

项目部署

为PaddleSpeech创建专属虚拟环境

Anaconda Power Shell中输入以下命令,创建python版本为【3.9】、名为【paddle_speech】的虚拟环境。建议使用【Python3.9】,亲测可用。

conda env list
conda create -n paddle_speech python=3.9

image-20230519085131444

激活 conda 虚拟环境:

conda activate paddle_speech

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值