Automatic Speech Recognition(ASR) 学习资源

本文介绍了语音识别领域的核心课程及关键技术,包括传统GMM+HMM方法与新兴的深度学习技术,如DNN和CNN在声学建模上的应用。同时列举了几门推荐课程和常用的开源工具,如Kaldi,并提及了大型词汇连续语音识别(LVCSR)的发展趋势。
Courses:
1.EECS E6870 — Fall 2012 Speech Recognition

2.CSE 6328 SPEECH AND LANGUAGE PROCESSING (FALL 2012)

3.CS 224S/LINGUIST 285 Spoken Language Processing Coming (语音与语言处理 作者开的课)

4.AUTOMATIC SPEECH RECOGNITION (ASR): 2013/14 (不少Neural Network方面的内容)


开源工具(C/C++):
1. HTK (较久远,早已不更新,)
2. kaldi (11年开始,很棒的学习工具,支持CUDA;有DNN+HMM)

large vocabulary continuous speech recognition (LVCSR)
目前有两种方式:
1.传统方法——GMM+HMM
2.近年ASR的breakthrough——NN(DNN、CNN)+HMM

LVCSR主要分:语言模型(Language Model)+声学模型+HMM

声学模型最初使用GMM建模,Deep Learning爆发之后,从09开始DL在声学建模上取得重大突破


图书:

语音技术


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值