
语音识别
ferb2015
北京邮电大学
wechat:dengdengkakaxi
展开
-
nabu日记
Nabu 是一套实现了LAS(listen, attend, spell)的语音识别系统。https://github.com/vrenkens/nabu LAS是一个基于Attention mechanism的encoder-decoder语音识别模型。相比与传统模型,LAS模型的输出结果是变长序列(decoder部分非常类似于RNN语言模型)。关于LAS的细节可以看论文: https://ar...原创 2019-03-14 11:11:22 · 1534 阅读 · 0 评论 -
SentencePiece,subword-nmt,bpe算法
BPE(Byte Pair Encoding,双字节编码)。2016年应用于机器翻译,解决 集外词(OOV)和罕见词(Rare word)问题。论文题目《Neural Machine Translation of Rare Words with Subword Units》 —发表于ACL2016 http://www.sohu.com/a/115373230_465975 tensor2ten...原创 2019-03-14 11:14:30 · 5278 阅读 · 0 评论 -
《数学之美》读书笔记
原创 2019-03-27 15:47:56 · 268 阅读 · 1 评论 -
《语音信号处理》 语音识别章节 读书笔记
P34 HMM是一个双内嵌式随机过程,由两个随机过程组成: 一个是状态转移序列,对应单纯markov过程;另一个是每次转移时输出的符号组成的符号序列。(这个也是随机的,理解为 不知道状态序列,也不知道输出符号序列。。。) P130: 模板(模型)Mi,即 i 单词的均值和协方差矩阵。 P135: 语音信号的特征矢量序列的集合作为观察值序列O = O1,O2,…OT P136: 声学...原创 2019-04-02 12:05:39 · 2157 阅读 · 0 评论