
语音识别
cug_coffee
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
高斯混合模型
高斯混合模型,首先说的那就是高斯分布, f(x)=12πσexp(−(x−μ)22σ2)=N(x,σ,μ2) f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\sigma^2})=N(x,\sigma,\mu^2) f(x)=2πσ1exp(−2σ2(x−μ)2)=N(x,σ,μ2) 对应的均值方差是μ\muμ,σ2\si...原创 2020-03-16 10:26:01 · 373 阅读 · 0 评论 -
最大似然估计
现在简单写写最大似然估计。 最大似然估计是一个概率估计问题,譬如已知一个数据空间XXX,数据XXX中的每一个样本都有n为特征。有样本整体x=[x1,x2,x3,x4,.....,xn]x=[x_1,x_2,x_3,x_4,.....,x_n]x=[x1,x2,x3,x4,.....,xn]。同时了有这样的先验知识,知道数据空间XXX里面所有的样本,都符合一个的概率密度函数(prob de...原创 2020-03-16 08:35:00 · 401 阅读 · 0 评论 -
fst-graph
这里就直接贴上代码了。 digraph G { node [shape = circle] 0 -> 1 [ label = sil ] 0 -> 2 [ label = w ] 1 -> 1 [ label = sil ] 1 -> 2 [ label = w ] 2 -> 2 [ label = w ] 2 -> 3 [ labe...原创 2020-03-05 13:34:03 · 491 阅读 · 0 评论 -
构图逻辑
现在写写一般的构图逻辑,这里会介绍ci-phone的,同时也会介绍cd-phone的构图逻辑。 一般介绍 ci-phone构图 cd-phone构图 下面先介绍下技术背景,主要应用在解码过程中,也就是语音识别;譬如唤醒、命令词都可以应用。对于一个词的发音序列 word : phn1 phn2 phn3 word: A B C D E ... Z 其中A就是词头,Z就是词尾。 先介绍ci-p...原创 2020-03-05 13:18:47 · 510 阅读 · 0 评论 -
语音识别--gmm-hmm思考
简单回顾一下今天所看的内容: gmm-hmm pdf: 概率密度函数,在这里可以由gmm来估计,同样也可以用dnn来估计。 gmm: 高斯混合模型,单高斯函数,多高斯函数。 能拟合任何函数,这里会涉及到均值方差等变量 语音有短时平稳的特性,可以用高斯混合模型来估计;从而就会有概率密度函数。 hmm:隐马尔科夫模型,双马尔科夫链的过程。关键在于理解状态。 首先需要的说的马尔科夫链。当与时间无关时,...原创 2020-03-01 01:29:51 · 477 阅读 · 0 评论 -
语音识别-先验概率后验概率似然函数
这里贴一个网页: https://www.cnblogs.com/wjgaas/p/4523779.html 简单的说: Posterior probability ∝ Likelihood × Prior probability 从语音识别的角度来看这个问题,那么就是,解码的过程就是求取后验概率的过程。 ref_W = argmax_w(p(O|W) * P(W)/P(O)) 已知观察...原创 2020-03-01 01:24:06 · 1323 阅读 · 0 评论 -
语音识别Topo笔记
这里记录一下语音识别中的拓扑的问题。 三因子状态的topo Chain-model的topo Ctc的topo 三因子状态的topo <Topology> <TopologyEntry> <ForPhones> 1 2 3 4 5 6 7 8 </ForPhones> <State> 0 <PdfClass> 0 <...原创 2020-03-01 01:18:06 · 253 阅读 · 0 评论