声明:语音开源项目主要分享优秀的开源项目,促进开源社区的壮大。所写的内容主要是我个人看法,如有错误,还望指正。如有转载,请标注来源。 欢迎关注微信公众号:低调奋进
The 2020 ESPnet update: new features, broadened applications, performance improvements, and future plans
ESPnet: end-to-end speech processing toolkit
具体文章链接:https://arxiv.org/pdf/2012.13006.pdf
项目链接:https://github.com/espnet/espnet

1 项目介绍
EspNet项目初建于2017年12月,刚开始只是为了处理语音识别(ASR)的实验。随着更多研究人员的加入,该项目越来越壮大,目前该项目支持更多领域的语音处理:automatic speech recognition(ASR), text-to-speech(TTS), voice conversion(VC), speech translation (ST)和speech enhancement(SE)等等。我们看一下从2018年到现在2020年之间的发展状况,由table1显示,该项目的引用每年都翻了好几倍,表明在学术界越来越多人关注,其贡献者也

ESPnet是一个始于2017年的开源项目,最初专注于语音识别,现扩展到支持ASR、TTS、VC、ST和SE等多个领域。随着引用次数和贡献者的增加,该项目展现出强大的活力。它涵盖了Hybrid DNN/HMM、CTC、Transformer等多种ASR算法, Tacotron2、FastSpeech等TTS技术,以及Transformer为基础的ST和SE解决方案。
最低0.47元/天 解锁文章
1047

被折叠的 条评论
为什么被折叠?



