前言
kaldi和古老的HTK相似,是一套自动语音识别工具。kaldi的面向不在于初学者,而是在于expert或者expert-training,所以有一定的门槛,但是也不用害怕,github上有它的源码和egs,下载开源代码和egs,多多练习,一步一步的运行代码,看会发生什么,总会有所收获。
kaldi虽然有一定的门槛,但是开发者也致力于提高代码的稳健性,可扩展性,尽量让代码结构清晰不太复杂,我也是个初学者,代码看着还是有点复杂,哈哈,努力学习,希望有所进步。
kaldi官网:http://www.kaldi-asr.org/,kaldi开源网址:https://github.com/kaldi-asr/kaldi,注意:kaldi是跨平台工具包,也可以部署在windows,但支持的应该没有类UNIX好,所以推荐大家使用类UNIX系统,如MacOS, ubuntu等。
我用的是虚拟机virtualbox上的Ubuntu16.04,首先安装git,在终端运行:sudo apt-get install git,之后运行sudo git clone https://github.com/kaldi-asr/kaldi.git,这样安装包就下载下来了。
安装(编译)
在安装kaldi之前,要安装一些dependencies:
sudo apt-get install subversion automake autoconf libtool g++ zlib1g-dev wget libatlas-dev libatlas-base-dev
下面按照下载的安装包kaldi下的INSTALL进行安装就可以了,想了一会还是贴一下吧:
cd tools;sudo make -j n,n指的是计算机的核数;cd ../src;sudo ./configure;sudo make all
注意:安装目录的空间最好大于20G,因为后面编译src的时候会需要很多空间,我是之前就8G,很多dependencies都没装完整老是报错,最后才发现是空间不足,最后又新建虚拟空间才完成编译,坑爹的设备,最后感谢这篇博客:virtualbox下Ubuntu扩充硬盘容量,未完待续。。。