语音识别开源软件--DeepSpeech（1）安装和使用

最新推荐文章于 2025-06-26 15:05:47 发布

原创

最新推荐文章于 2025-06-26 15:05:47 发布 · 1.8w 阅读

54 ·

CC 4.0 BY-SA版权

文章标签：

#DeepSpeech #语音转文字 #语音识别

本文介绍了如何安装和使用开源语音识别软件DeepSpeech，包括从Git克隆项目、下载模型和音频文件，以及如何通过Python调用模型进行语音转文字。还提到了Git LFS在处理大文件时的作用，并给出了训练LDC03s1数据集的步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

语音转文字开源软件- DeepSpeech（1）安装和使用

DeepSpeech Git 地址：https://github.com/mozilla/DeepSpeech
Mozilla 的语料库：https://voice.mozilla.org/en/languages

实验

克隆Git: git clone https://github.com/mozilla/DeepSpeech
下载训练好model: wget https://github.com/mozilla/DeepSpeech/releases/download/v0.4.1/deepspeech-0.4.1-models.tar.gz
解压： tar xvfz deepspeech-0.4.1-models.tar.gz
下载测试音频：
wget https://github.com/mozilla/DeepSpeech/releases/download/v0.4.1/audio-0.4.1.tar.gz
解压: tar xvfz audio-0.4.1.tar.gz
安裝： pip3 install deepspeech-gpu
帮助： deepspeech --help
测试功能：
deepspeech --model models/output_graph.pbmm --alphabet models/alphabet.txt --lm models/lm.binary --trie models/trie --audio my_audio_file.wav

如何用python 调用模型

#!/usr/bin/env python
# -*- coding: utf-8 -*-
from __future__ import absolute_import, division,

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

VickyG9

关注关注

5
点赞
踩
54

收藏

觉得还不错? 一键收藏
6
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python 语音转文字中文—vosk

秋元的博客

01-10

3211

Vosk 提供了一种高效、轻量的离线语音转文本解决方案。通过本文示例，您可以快速上手音频文件的转录及实时语音识别，并在隐私敏感或网络受限场景下广泛应用。Vosk 是一个基于 Kaldi 的开源语音识别工具包，支持离线语音识别。其特点是轻量、高效，并支持多种语言，适用于实时语音转文本场景。以下示例以 Python 为例，展示如何使用 Vosk 实现音频转文本。根据语言选择合适的 Vosk 模型。

安装DeepSpeech2（GPU）实现语音识别

qq_41545075的博客

11-24

3934

安装语音识别需要的环境以及整个模型的部署训练和实现。

6 条评论您还未登录，请先登录后发表或查看评论

【C#】WPF+ Ollama 实现本地 Deepseek模型对话

最新发布

weixin_44066506的博客

06-26

826

WPF+OllamaSharpe实现本地聊天功能,可以选择使用Deepseek 及其他模型。以上为项目的全部代码，下面是最后总结。也可以关注微信公众号 [编程笔记in] 社区，共同学习交流！项目源码。

DeepSpeech v1安装与训练

hw200855的博客

03-06

5524

1 安装git-lfs curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.rpm.sh | sudo bash sudo apt-get install git-lfs 这一步不能漏了，不安装这一步后面git clone获取的deepspeech代码没有相应的语言模型。会出现如下的错误： ...

01、DeepSpeech2在windows下的部署与测试

云上凯歌

10-12

1870

安装Microsoft C++ 生成工具 - Visual Studio：https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/实践中选择字错率最低的下载，下载完成后解压，将dataset文件夹中mean_std.npz与zh_vocab.txt拷贝至源码**./dataset**目录下，将models文件夹拷贝至源码根目录下。Anaconda 官网：https://www.anaconda.com/download/

DeepSpeech:开源嵌入式语音识别引擎

2401_87189860的博客

10-09

5624

DeepSpeech作为一个开源的嵌入式语音识别引擎,为开发者和研究人员提供了一个强大的工具,推动了语音识别技术的民主化。虽然在某些方面还不及商业系统,但其开放性、可定制性和持续改进的特点,使其在特定应用场景中具有独特优势。随着技术的不断进步和社区的共同努力,DeepSpeech必将在语音识别领域发挥越来越重要的作用。

DeepSpeech 怎么下载模型

weixin_35755188的博客

01-21

1045

可以在 DeepSpeech 的 GitHub 页面上找到模型下载链接。可以选择下载预训练模型或者训练自己的模型。还可以使用 pip 安装 DeepSpeech。命令： pipinstall deepspeech ...

DeepSpeech的使用尝试Linux环境下

qq_45978862的博客

10-05

2129

DeepSpeech的初次尝试运行

语音识别开源软件-- DeepSpeech（2）训练中文数据源thchs30

weixin_36071429的博客

01-22

9598

DeepSpeech（2）训练中文数据源thchs30 Thchs30数据源是清华大学的30小时公用数据集下载地址： http://www.openslr.org/18/ 相关软件安装基本安装：首先是文档DeepSpeech(1)所提到的安装见 n-gram处理工具kenlm： $ git clone https://github.com/kpu/kenlm $...

DeepSpeech2 语音识别.zip

08-23

在“PaddlePaddle-DeepSpeech-master”压缩包中，包含了完整的代码示例和训练数据，用户只需按照提供的指南配置环境，即可开始训练自己的语音识别模型。四、训练与优化训练DeepSpeech2模型通常涉及以下几个步骤...

DeepSpeech：DeepSpeech是一种开源嵌入式（离线，设备上的）语音到文本引擎，可以在从Raspberry Pi 4到大功率GPU服务器的各种设备上实时运行

02-04

在压缩包文件"DeepSpeech-master"中，可能包含了项目的源代码、训练数据、预训练模型、文档和其他相关资源。开发者和研究人员可以下载并研究这些内容，以便进一步了解和定制DeepSpeech，以满足特定需求或进行学术...

PaddlePaddle-DeepSpeech中文语音识别模型（free_st_chinese_mandarin_corpus）

03-19

PaddlePaddle-DeepSpeech中文语音识别模型（free_st_chinese_mandarin_corpus数据集训练的）项目地址：https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/tree/release/1.0

deep speech2

07-16

百度二代语音识别，采用paddlepaddle平台，继续使用ctc（端到端）的语音识别

Deep Speech 百度框架

01-21

Deep Speech 百度框架端到端 语音识别 LSTM-CTC 中文和英文

语音转文字demo——pip安装DeepSpeech体验

热门推荐

迷宫中的我

05-12

1万+

0 环境 Ubuntu 18.04.2 LTS的电脑即可。我的电脑是i3-6100CPU，无外接GPU，内存8G。64位系统。 Python 3.6.7（以前电脑就安装了） TensorFlow 1.12.0（以前电脑就安装了） DeepSpeech 0.4.1 1 要求要求电脑是Linux或者Mac。python 3.6 2 简介 DeepSpeech是Mozilla开源的软件...

DeepSpeech2在windows下的部署与测试

weixin_42144294的博客

04-08

5591

1.部署环境 win11+anaconda3+python3.7+cuda10.0+cudnn7.6.0+PaddlePaddle 2.1.2 2.源码下载下载链接：https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech 3.搭建环境（1）安装PaddlePaddle-GPU版本 conda activate xxx #为与其它环境相互干扰，创建的虚拟环境，进入虚拟环境下，进行以下操作 conda install paddlepaddle-gpu

DeepSpeech 项目使用教程

gitblog_01073的博客

08-08

1284

DeepSpeech 项目使用教程 DeepSpeechDeepSpeech is an open source embedded (offline, on-device) speech-to-text engine which can run in real time on devices ranging from a Raspberry Pi 4 to high power GPU serv...

ubuntu使用DeepSpeech进行语音识别（包含交叉编译）

山河君的分享博客

11-07

2801

由于工作需要语音识别的功能，环境是在linux arm版上，所以想先在ubuntu上跑起来看一看，就找了一下语音识别的开源框架，选中了很多框架可以看编译vosk那篇文章，现在一一试验一下。本篇博客将会在ubuntu上进行DeepSpeech编译使用，并且进行交叉编译。版本声明：山河君，未经博主允许，禁止转载目前已经尝试过vosk、PocketSphinx，有兴趣的话可以看看之前的文章，实际上还有两个没有记录出来，Snowboy和Julius，有兴趣的小伙伴可以一起探讨。

DeepSpeech 怎么下载模型,我是个小白,可以教教我吗

weixin_42575505的博客

01-21

370

可以的。首先，你需要安装 TensorFlow。如果你是在 Windows 上安装，可以参考 TensorFlow 官网上的安装说明，如果你是在 Linux 或 MacOS 上安装，可以在命令行中输入以下命令： pipinstall tensorflow ...

DeepSpeech-API: 使用Mozilla模型在浏览器实现语音转文本

8.安装依赖项:在使用DeepSpeech-API之前，需要在用户的平台上安装相关的依赖项。具体的安装方法和依赖项可以在项目的官方网站或者文档中找到。 9.跨平台使用:DeepSpeech-API支持在多个平台上使用，包括Windows、IOS...

语音识别开源软件--DeepSpeech（1） 安装和使用

语音转文字开源软件- DeepSpeech（1） 安装和使用

实验

如何用python 调用模型

语音识别开源软件--DeepSpeech（1）安装和使用

语音转文字开源软件- DeepSpeech（1）安装和使用