
语音识别
文章平均质量分 85
遇逆境处之泰然
分享语音识别,欢迎一起学习交流。
展开
-
kaldi nnet3实时解码(使用麦克风在线解码)
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2021-03-31 10:27:35 · 2194 阅读 · 10 评论 -
Chain模型神经网络前向计算
Kaldi原创 2019-12-02 15:38:16 · 1309 阅读 · 2 评论 -
MFCC特征提取--基于kaldi裁剪
0. 前言关于MFCC相关原理,这里就不过多叙述了,网上的参考资料也比较多,自己对MFCC原理理解也不是很深刻(方向不一样),主要介绍本人对kaldi mfcc特征提取代码裁剪后的接口,此处开源的MFCC不含pitch特征提取。详细代码1. Github代码结构介绍在介绍之前,提及一点,若要运行,请先阅读README.md编译外部库。特征提取的代码在src/feat目录下,测试代码在sr...原创 2019-11-07 15:14:20 · 1085 阅读 · 2 评论 -
Kaldi Chain解码器系列介绍
前言Kaldi解码器针对唤醒词或特定场景控制词来说,过于臃肿,占用内存较大,为了使得解码流程能够清晰并且精简,以及方便移植一些不支持C++的平台(代码C语言实现解码器,下文Github中仅给出C++的实现,C++实现移除了类的定义,以及对象的思想,和C一样,是基于面向过程的,所以只需替换vector,hashmap等接口即可,C语言代码实现目前不公开),仅以此系列文章纪念kaldi解码器裁剪的辛...原创 2019-11-07 11:37:28 · 1386 阅读 · 3 评论 -
Kaldi解码加速策略概述
0. 前言本文介绍几种优化解码器加速方法,基于kaldi chain模型解码器(online2-wav-nnet3-latgen-faster),训练的模型用于唤醒词场景,主要优化内容包含:特征提取、TDNN神经网络计算、FST优化、lattice获取1-best等。除了以上方法,kaldi解码器、openfst、openblas等在编译时添加 -O3 优化选项 和 硬浮点运算(需硬件支持)的...原创 2019-10-08 22:43:39 · 4755 阅读 · 8 评论 -
kaldi解码器在嵌入式平台运行
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言 前面的博文kaldi源码的交叉编译已经将嵌入式平台的解码器编译完成,解码器有GMM、nnet2、nnet3等等,GMM解码器又分为单音素、三音素解码,本博文介绍如何设置解码器参数,并在嵌入式平台运行解码器。GMM解码器1. 在线识别online-gmm-decode-faster以单音素模...原创 2019-03-18 15:54:35 · 3457 阅读 · 3 评论 -
基于kaldi训练唤醒词模型的一种方法
0. 前言 什么是唤醒?激活Google智能助手,你可以对手机说“Hey Google”或者“OK Google”,其他诸如阿里的天猫精灵智能音箱(天猫精灵)、京东的叮咚智能音箱(叮咚叮咚),百度语音助手(小度小度)等等,需要采用唤醒词才能激活设备,然后再对设备进行一系列控制语音输入,一方面减小了智能音箱执行错误操作的概率,另一方面也降低了整个设备的功耗。本文基于开源语音识别kaldi平...原创 2019-03-07 14:19:59 · 11714 阅读 · 33 评论 -
嵌入式平台Alsa的交叉编译
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言:alsa的介绍不多说,自行百度...^ ^alsa lib下载:官网http://www.alsa-project.org/main/index.php/Main_Page下载的是alsa-lib-1.1.7, 具体版本需参考开发板的版本alsa lib的编译:1. 解压alsa-l...原创 2018-11-29 11:15:04 · 1240 阅读 · 4 评论 -
嵌入式平台kaldi源码的交叉编译
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言:在编译kaldi源码时,请先参照https://www.jianshu.com/p/05e1bbe0ca3a这篇文章在x86平台能够编译后,再进行以下操作。Kaldi交叉编译:1. 确保openfst已经编译完成(见openFst的交叉编译),并且存放路径为:kaldi/tools/openf...原创 2018-11-29 11:18:58 · 3402 阅读 · 12 评论 -
嵌入式平台Portaudio的交叉编译
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言:PortAudio是一个免费的、跨平台的、开放源码的音频I/O库,kaldi在online gmm针对流式解码时,使用了该开源框架,像DNN解码,kaldi暂时未提供流解码,使用的还是wav解码,详细见src/online2bin/下的一些解码器程序,针对一些特定场景,需要移植流解码,就有可能还需用到por...原创 2018-11-29 11:16:10 · 3153 阅读 · 2 评论 -
嵌入式平台OpenBlas及Clapack的交叉编译
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言:OpenBlas是一款开源的矩阵运算库,具体介绍参考http://www.openblas.net/。在linux PC上,即训练时,采用的数学矩阵库为atlas,此数学库未开源,在linux中只提供lib库,所以在嵌入式平台中,我们需要编译openblas生成对应的数学矩阵库。除OpenBlas外,...原创 2018-11-29 11:14:12 · 3384 阅读 · 8 评论 -
嵌入式平台openFst的交叉编译
该博文属于系列文章,其他文章参考总览:kaldi嵌入式平台的移植及实现前言:openfst的介绍就不必了,大家自行百度,下面进入正题。Openfst下载:目前kaldi版本为5.5,使用的openfst的版本为openfst-1.6.7.tar.gz,进入openfst官网,找到对应的tar.gz下载,如下图Openfst的交叉编译:1. 拷贝openfst-1...原创 2018-11-29 11:12:31 · 3082 阅读 · 4 评论 -
kaldi嵌入式平台的移植及实现
本系列包含内容分以下几篇文章介绍:1. openFst的交叉编译2. 数学库OpenBlas及Clapack的交叉编译3. 音频接口Alsa的交叉编译4. 音频框架portaudio的交叉编译(基于音频流处理,详细参考kaldi解码器源码onlinebin/online-gmm-decode-faster.cc)5. kaldi源码的交叉编译6. kaldi在嵌入式平台解...原创 2018-11-29 11:03:27 · 4263 阅读 · 0 评论 -
Kaldi aishell2 GMM训练步骤(含aishell1语料转aishell2组织方式)
0 前言 中文语音识别的aishell2推出已经有一段时间了,由于没有aishell2的语料库,有资格的可以申请,所以拿aishell1的15G语料进行训练,所以写了相关的脚本处理aishell1的语料库,来适配aishell2,可以参考我的github 仓库aishell2_gmm_train1 语料转换 下载完aishell1的语料后,将data_ai...原创 2018-09-12 22:31:42 · 5316 阅读 · 8 评论