Courses:
1.EECS E6870 — Fall 2012 Speech Recognition
开源工具(C/C++):
1. HTK (较久远,早已不更新,)
2. kaldi (11年开始,很棒的学习工具,支持CUDA;有DNN+HMM)
large vocabulary continuous speech recognition (LVCSR)
目前有两种方式:
1.传统方法——GMM+HMM
2.近年ASR的breakthrough——NN(DNN、CNN)+HMM
1.EECS E6870 — Fall 2012 Speech Recognition
2.CSE 6328 SPEECH AND LANGUAGE PROCESSING (FALL 2012)
3.CS 224S/LINGUIST 285 Spoken Language Processing Coming (语音与语言处理 作者开的课)
4.AUTOMATIC SPEECH RECOGNITION (ASR): 2013/14 (不少Neural Network方面的内容)
开源工具(C/C++):
1. HTK (较久远,早已不更新,)
2. kaldi (11年开始,很棒的学习工具,支持CUDA;有DNN+HMM)
large vocabulary continuous speech recognition (LVCSR)
目前有两种方式:
1.传统方法——GMM+HMM
2.近年ASR的breakthrough——NN(DNN、CNN)+HMM
LVCSR主要分:语言模型(Language Model)+声学模型+HMM
声学模型最初使用GMM建模,Deep Learning爆发之后,从09开始DL在声学建模上取得重大突破
图书: