
语音
文章平均质量分 59
语音方面知识
佰宝
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【语音】viterbi 与 beam search
triphone通常是用在“连续语音识别”的系统里的,这样的系统中viterbi不会用在单个的triphone HMM上。“数字识别”这类离散识别的任务可能会出现viterbi用在单个HMM上的情况,其中每个数字用一个HMM表示,包含十几到几十个状态。这种情况下不需要用到beam,因为状态不多,viterbi算起来也很快。然后是beam search。beam search是viterbi的一种近似解法。需要近似的原因是通常”连续语音识别“的解码图通常很大(由上千个HMM加上词典和语言模型生成),状态数都是转载 2022-03-21 10:12:42 · 340 阅读 · 0 评论 -
【语音】语音识别中的HMM-GMM模型:从一段语音说起
语音识别中的HMM-GMM模型:从一段语音说起虽然现在端到端语音识别模型可以直接对后验概率建模,可以不需要HMM结构了。但实际上目前很多state-of-the-art模型还是以HMM结构为主,比如chain model。而且掌握HMM-GMM结构,对于深入理解语音识别过程是由有一定好处的。但对于外行或者刚接触语音识别的人来说,要弄懂HMM-GMM结构还是要花不少时间的,特别是被一大推公式整懵了。语音识别任务有些特殊,比如语音识别中,标注只是针对整段音频的,而不是针对每一帧;语音识别是针对每个音素都建转载 2022-03-21 10:34:37 · 2099 阅读 · 0 评论