深度神经网络是语音识别里最先进的热点话题,从大概2010年左右开始,许多在这个领域的论文陆续发表,像谷歌、微软等大公司正在开始在他们的产品系统里使用DNNs。由于最新的技术持续改变意味着代码需要跟上,也意味着许多结构需要重新思考,所以对于活跃的研究领域,一个工具包比如kaldi,很难支持很好。
在kaldi中,我们目前针对深度神经网络提供三种代码库。它们都很有意义,因为很难多recipe都参考它们。第一个是“nnet1”(位于nnet/和nnetbin/下),最初由karel Vesely维护;第二个(位于nnet2/和nnet2bin/下)最初由Daniel Povey维护(代码是Karel‘s的基础上大幅改写而来);第三个(位于