手把手教学!新一代 Kaldi: TTS Runtime ASR 实时本地语音识别 语音合成来啦

简介

本文向大家介绍如何在新一代 Kaldi的部署框架 **sherpa-onnx**中使用 TTS

注:sherpa-onnx 提供的是一个TTS runtime, 即部署环境。它并不支持模型训练。 本文使用的测试模型,都是来源于网上开源的 VITS 预训练模型。
我们提供了 ONNX 导出的支持。如果你也有 VITS 预训练模型,欢迎尝试使用 sherpa-onnx 进行部署。

安装

最快速的安装方式是:

### 安装和配置新一代 Kaldi (sherpa-onnx) on 树莓派 #### 准备工作 确保树莓派已更新至最新版本的操作系统并安装必要的依赖项。对于基于 Debian 或 Ubuntu 的发行版,可以使用以下命令来更新软件包列表并升级现有软件包: ```bash sudo apt update && sudo apt upgrade -y ``` #### 安装依赖库 为了使 `sherpa-onnx` 正常运行,在树莓派上还需要额外安装一些Python库和其他工具链。执行如下指令完成这些前置条件的部署[^2]: ```bash sudo apt install python3-pip libasound2-dev portaudio19-dev pip3 install --upgrade pip setuptools wheel ``` #### 获取预编译模型文件 下载适用于 ARM 架构的 ONNX 模型以及相应的解码资源。可以从官方GitHub仓库或者其他可信源获取所需资源,并将其放置于合适的位置以便后续调用。 ```bash mkdir -p ~/kaldi-models && cd ~/kaldi-models wget https://github.com/k2-fsa/sherpa/releases/download/v0.6.0/offline-zip-ctc-aishell.zip unzip offline-zip-ctc-aishell.zip ``` #### 安装 Sherpa-Onnx Python 包 通过 PyPI 来安装最新的 `sherpa-onnx` 版本,这一步骤会自动处理大部分兼容性和路径设置问题。 ```bash pip3 install sherpa-onnx ``` #### 编写测试脚本 创建一个新的 Python 文件用于验证安装是否成功,同时也可以作为未来开发的基础框架。 ```python import wave from pathlib import Path import sherpa_onnx def main(): recognizer = sherpa_onnx.Recognizer( tokens=Path("~/kaldi-models/tokens.txt").expanduser(), encoder=Path("~/kaldi-models/encoder.onnx").expanduser(), decoder=Path("~/kaldi-models/decoder.onnx").expanduser(), joiner=Path("~/kaldi-models/joiner.onnx").expanduser() ) with wave.open("/path/to/test.wav") as f: samples = f.readframes(f.getnframes()) result = recognizer.decode(samples) print(result) if __name__ == "__main__": main() ``` 以上就是关于如何在树莓派设备上安装和初步应用新一代 Kaldi (`sherpa-onnx`) 进行语音识别的过程介绍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

南七小僧

打赏后,可以添加微信一对一咨询

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值