- 博客(4)
- 收藏
- 关注
原创 Keras函数集锦(收集贴……)
万丈高山,从平地走起Introto_categoricalrepeatdropoutin_train_phaseIntro这篇博文用于记录一些keras的函数用法和示例,以及部分函数的实现原理。方便自己查阅。因为原始keras的backend没法直接输出结果,所以这里我直接用的tf2.0,如果直接在keras中使用,去掉tensorflow就行啦。to_categori...
2019-12-09 11:38:07
406
翻译 声学似然度的计算
1. forward algorithm一个HMM的Acoustic likelihood可以用前向算法(forward algorithm)来计算。给定一个HMM模型MMM,一个特征向量序列o1,o2,...oTo_1,o_2,...o_To1,o2,...oT,模型MMM能够生成OOO的似然度, 即声学似然度P(O∣M)P(O|M)P(O∣M)定义如下:(1)P(O∣M)=∑SP(O...
2018-10-20 17:04:46
800
原创 语言模型 (language model) 之n-gram LM
高山万丈,从平路走起语言模型是通过一个语音识别器来定义一系列的词的这么个东西。一些语言模型还会给每一个词序列一个权重或者概率,来当做这个词序列的language score,来彰显词序列的重要程度。有了语言模型,不符合语法规则或者看着就不像句子的输出就可以直接被排除掉,识别错误的情况也会大大减小。毕竟声学模型并不会考虑输出的像不像一句话,它只是听概率的话。今儿来总结下 n-gram la...
2018-10-19 22:35:28
4335
2
原创 中文语音识别(一) 数据准备
万丈高山,从平路走起。1. Create wav.scp, utt2spk.scp, spk2utt.scp, text1.1 创建 train,dev,test三个文件夹用来存储数据mkdir -p data/{train,dev,test}1.2 根据原始数据,生成标题中的文本,涉及到的一些指令总结下,主要是下面这句话中的:for nn in `find $corpus_dir...
2018-10-18 20:53:19
1772
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人