Automatic Speech Recognition(ASR) 学习资源

最新推荐文章于 2024-02-01 16:16:59 发布

原创最新推荐文章于 2024-02-01 16:16:59 发布 · 6.2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

语音识别专栏收录该内容

4 篇文章

订阅专栏

本文介绍了语音识别领域的核心课程及关键技术，包括传统GMM+HMM方法与新兴的深度学习技术，如DNN和CNN在声学建模上的应用。同时列举了几门推荐课程和常用的开源工具，如Kaldi，并提及了大型词汇连续语音识别(LVCSR)的发展趋势。

Courses:
1.EECS E6870 — Fall 2012 Speech Recognition

2.CSE 6328 SPEECH AND LANGUAGE PROCESSING (FALL 2012)

3.CS 224S/LINGUIST 285 Spoken Language Processing Coming （语音与语言处理作者开的课）

4.AUTOMATIC SPEECH RECOGNITION (ASR): 2013/14 (不少Neural Network方面的内容)

开源工具(C/C++)：
1. HTK (较久远，早已不更新，)
2. kaldi (11年开始，很棒的学习工具，支持CUDA；有DNN+HMM)

large vocabulary continuous speech recognition (LVCSR)
目前有两种方式：
1.传统方法——GMM+HMM
2.近年ASR的breakthrough——NN(DNN、CNN)+HMM

LVCSR主要分：语言模型(Language Model)+声学模型+HMM

声学模型最初使用GMM建模，Deep Learning爆发之后，从09开始DL在声学建模上取得重大突破

图书：

语音技术

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。